Microsoft umożliwi Ci klonowanie głosu na potrzeby połączeń w aplikacji Teams, obsługiwanych przez sztuczną inteligencję

Użytkownicy Microsoft Teams wkrótce będą mogli używać sklonowanych wersji swoich głosów do mówienia i tłumaczenia rozmów w czasie rzeczywistym, ponieważ firma przedstawia nowe narzędzie Tłumacza oparte na sztucznej inteligencji.

Ogłoszone na corocznym Microsoft Ignite konferencja i relacjonowana przez TechCrunchnowa funkcja umożliwia użytkownikom tworzenie cyfrowych replik ich głosów, które można następnie wykorzystać do tłumaczenia ich mowy na różne języki. „Wyobraź sobie, że możesz brzmieć tak samo jak Ty w innym języku. Tłumacz w aplikacji Teams zapewnia tłumaczenie mowy na mowę w czasie rzeczywistym podczas spotkań i możesz zdecydować się na symulowanie Twojego głosu, aby zapewnić bardziej osobiste i wciągające wrażenia.” – napisał CMO firmy Microsoft Jared Spataro w poście na blogu udostępnionym w publikacji.

ZOBACZ TAKŻE:

Instagram pozwoli użytkownikom „zresetować” polecane treści

Ta funkcja będzie dostępna tylko dla subskrybentów Microsoft365 i początkowo będzie dostępna w językach angielskim, francuskim, niemieckim, włoskim, japońskim, koreańskim, portugalskim, chińskim mandaryńskim i hiszpańskim.

Zmienna prędkość światła

Tłumacz ustny firmy Microsoft ma potencjał, aby uczynić pracę zdalną i socjalizację cyfrową bardziej dostępną dla szerszego grona osób niemówiących po angielsku, choć nie jest jeszcze tak dynamiczny jak tłumacz na żywo. Poza swoim wyraźnym zastosowaniem narzędzie rodzi jeszcze więcej pytań dotyczących bezpieczeństwa i uprzedzeń technologicznych.

Niedawne badanie odkryli, że popularne narzędzie do transkrypcji oparte na sztucznej inteligencji Whisper — używane również w programach Microsoftu do przetwarzania w chmurze — było podatne na halucynacje, w tym wymyślanie treści lub wyrażeń podczas tłumaczenia informacji o pacjencie w dziedzinie medycyny. Było to szczególnie prawdziwe w przypadku pacjentów z zaburzeniami mowy, takimi jak afazja. Wcześniej popularna przypinka Humane AI, reklamowana ze względu na możliwości tłumaczenia na żywo, okazała się być niezgodny cyfrowa alternatywa dla tłumaczenia ludzkiego. Odnosząc się do podobnych obaw związanych z tłumaczem Teams, Microsoft powiedział TechCrunch: „Interpreter został zaprojektowany tak, aby jak najwierniej odtworzyć wiadomość mówiącego, bez dodawania założeń lub obcych informacji. Symulację głosu można włączyć tylko wtedy, gdy użytkownicy wyrażą zgodę za pośrednictwem powiadomienia podczas spotkania lub włączenie opcji „Zgoda na symulację głosu” w ustawieniach.”

Technologia ta może mieć ogromne implikacje w przestrzeni dostępności, a takie osobistości są godne uwagi Przedstawicielka USA Jennifer Wexton zwiększenie wykorzystania spersonalizowanego, zaawansowanego technologicznie klonowania głosu w przypadku osób z nietypową mową. Wzbudziło to jednak również obawy dotyczące bezsensownego wykorzystania deepfake’ów i potencjału tej technologii jako narzędzia w arsenale oszustów. Potężna technologia klonowania mowy AI — podobno firmy Microsoft imponująco podobny do człowieka — wzbudziło wątpliwości etyczne u samego dyrektora generalnego Microsoftu wzywając do silniejszych poręczy oraz zarządzanie sztuczną inteligencją w obliczu rosnącej liczby deepfake’ów wśród gwiazd.

Mimo to zamieszanie wokół klonowania głosu, wzmocnione przez szaleństwo sztucznej inteligencji, nasiliło się jedynie wśród innowatorów w branży, uzupełniając poprzednie inwestycje w tłumaczenie mowy na tekst oparte na sztucznej inteligencji. W zeszłym roku Apple ogłosiło wprowadzenie funkcji Personal Voice – narzędzia do uczenia maszynowego, które tworzy syntetyzowaną wersję głosu użytkownika, której można używać w sytuacjach zamiany tekstu na mowę na żywo, takich jak FaceTime, i było reklamowane jako ułatwienie dostępu. Microsoft zaprezentował swój własny Głos osobisty dostępna mniej więcej w tym samym czasie, oparta na sztucznej inteligencji platformy Azure i dostępna w 90 językach.



Zrodlo