We wtorek OpenAI udostępniło funkcję zaawansowanego trybu głosowego wszystkim płatnym użytkownikom ChatGPT. Ta funkcja została po raz pierwszy zaprezentowana podczas wiosennej aktualizacji OpenAI w maju i była reklamowana jako czat głosowy przypominający ludzki, w którym sztuczna inteligencja (AI) może wyrażać emocje, modulować głos i reagować na to, co mówi użytkownik. W lipcu dla wybranych płatnych użytkowników wprowadzono funkcję odpowiedzi w czasie rzeczywistym, ale teraz jest ona dostępna dla wszystkich użytkowników ChatGPT Plus i Teams, z wyjątkiem Europy.
OpenAI udostępniło zaawansowany tryb głosowy w ChatGPT
w post na X (wcześniej znanym jako Twitter) oficjalny uchwyt OpenAI ogłosił nową funkcję i podzielił się szczegółami na jej temat. Ta funkcja jest integrowana z aplikacją ChatGPT na Androida i iOS, ale nie będzie dostępna w Internecie. Firma zajmująca się sztuczną inteligencją powiedziała, że gdy funkcja zostanie udostępniona użytkownikom, otrzymają o tym powiadomienie.
Usługa Advanced Voice będzie udostępniana wszystkim użytkownikom Plus i Team w aplikacji ChatGPT w ciągu tygodnia.
Podczas gdy cierpliwie czekaliście, dodaliśmy instrukcje niestandardowe, pamięć, pięć nowych głosów i ulepszone akcenty.
Może także powiedzieć „Przepraszam za spóźnienie” w ponad 50 językach. pic.twitter.com/APOqqhXtDg
— OpenAI (@OpenAI) 24 września 2024 r
Użytkownicy aplikacji ChatGPT znajdą opcję włączenia zaawansowanego trybu głosowego, dotykając ikony przebiegu umieszczonej obok pola tekstowego. Kliknięcie ikony aktywuje nowy tryb głosowy. Użytkownicy mają teraz do wyboru pięć nowych głosów — Vale, Spruce, Arbor, Maple i Sol. Każdy z tych głosów ma inną wysokość, tonację i regionalny akcent.
Dodatkowo zaawansowany tryb głosowy oferuje także funkcję niestandardowych instrukcji. W ten sposób użytkownicy mogą dodawać informacje o sobie, które mają zapamiętać sztuczna inteligencja. Po dodaniu informacji do pola tekstowego ChatGPT zapamięta je, a wszystkie jego odpowiedzi zostaną dostosowane do kontekstu.
Warto zauważyć, że OpenAI była pierwszą firmą zajmującą się sztuczną inteligencją, która ogłosiła tę funkcję, jednak Google był w stanie wprowadzić podobną funkcję o nazwie Gemini Live, przed twórcą ChatGPT. Chociaż przyczyna tego nie jest znana, firma twierdzi obecnie, że zwiększenie „szybkości, płynności i akcentów w wybranych językach obcych” wymagało dodatkowego czasu.
Chociaż funkcja jest dostępna w wielu regionach na całym świecie, firma potwierdziła, że nie zostanie wprowadzona w UE, Wielkiej Brytanii, Szwajcarii, Islandii, Norwegii i Liechtensteinie. Dzieje się tak prawdopodobnie ze względu na obawy organów regulacyjnych dotyczące prywatności i gromadzenia danych.