Zaawansowany tryb głosowy OpenAI z ludzką mową emocjonalną udostępnianą wszystkim płatnym użytkownikom ChatGPT

We wtorek OpenAI udostępniło funkcję zaawansowanego trybu głosowego wszystkim płatnym użytkownikom ChatGPT. Ta funkcja została po raz pierwszy zaprezentowana podczas wiosennej aktualizacji OpenAI w maju i była reklamowana jako czat głosowy przypominający ludzki, w którym sztuczna inteligencja (AI) może wyrażać emocje, modulować głos i reagować na to, co mówi użytkownik. W lipcu dla wybranych płatnych użytkowników wprowadzono funkcję odpowiedzi w czasie rzeczywistym, ale teraz jest ona dostępna dla wszystkich użytkowników ChatGPT Plus i Teams, z wyjątkiem Europy.

OpenAI udostępniło zaawansowany tryb głosowy w ChatGPT

w post na X (wcześniej znanym jako Twitter) oficjalny uchwyt OpenAI ogłosił nową funkcję i podzielił się szczegółami na jej temat. Ta funkcja jest integrowana z aplikacją ChatGPT na Androida i iOS, ale nie będzie dostępna w Internecie. Firma zajmująca się sztuczną inteligencją powiedziała, że ​​gdy funkcja zostanie udostępniona użytkownikom, otrzymają o tym powiadomienie.

Użytkownicy aplikacji ChatGPT znajdą opcję włączenia zaawansowanego trybu głosowego, dotykając ikony przebiegu umieszczonej obok pola tekstowego. Kliknięcie ikony aktywuje nowy tryb głosowy. Użytkownicy mają teraz do wyboru pięć nowych głosów — Vale, Spruce, Arbor, Maple i Sol. Każdy z tych głosów ma inną wysokość, tonację i regionalny akcent.

Dodatkowo zaawansowany tryb głosowy oferuje także funkcję niestandardowych instrukcji. W ten sposób użytkownicy mogą dodawać informacje o sobie, które mają zapamiętać sztuczna inteligencja. Po dodaniu informacji do pola tekstowego ChatGPT zapamięta je, a wszystkie jego odpowiedzi zostaną dostosowane do kontekstu.

Warto zauważyć, że OpenAI była pierwszą firmą zajmującą się sztuczną inteligencją, która ogłosiła tę funkcję, jednak Google był w stanie wprowadzić podobną funkcję o nazwie Gemini Live, przed twórcą ChatGPT. Choć przyczyna tego nie jest znana, firma twierdzi obecnie, że zwiększenie „szybkości, płynności i akcentów w wybranych językach obcych” wymagało dodatkowego czasu.

Chociaż funkcja jest dostępna w wielu regionach na całym świecie, firma potwierdziła, że ​​nie zostanie wprowadzona w UE, Wielkiej Brytanii, Szwajcarii, Islandii, Norwegii i Liechtensteinie. Dzieje się tak prawdopodobnie ze względu na obawy organów regulacyjnych dotyczące prywatności i gromadzenia danych.



Zrodlo