Odyssey buduje „hollywoodzki” model AI Text-to-Video, aby konkurować z Sora, Gen-3 Alpha

Odyssey, startup zajmujący się sztuczną inteligencją (AI), założony w zeszłym roku, udostępnił w poniedziałek szczegóły dotyczące swojego pierwszego produktu AI. Firma ujawniła, że ​​buduje model wideo AI, który może tworzyć efekty wizualne klasy Hollywood, podobnie jak narzędzie Sora firmy OpenAI, które ma zostać jeszcze wydane przez firmę. Współzałożyciel Odyssey mówi, że model AI pozwoli użytkownikom edytować i kontrolować dane wyjściowe na poziomie szczegółowym, dodając, że firma współpracuje z wieloma dużymi modelami językowymi (LLM), aby generować różne warstwy wyjściowego wideo, które można kontrolować osobno.

Jak działa wizualny model sztucznej inteligencji Odyssey

W serii postów na X (dawniej Twitter) dyrektor generalny i współzałożyciel Odyssey, Oliver Cameron, poinformował, że startup zajmujący się sztuczną inteligencją pozyskał 9 milionów dolarów (ok. 75,1 crore rupii) w ramach rundy finansowania zalążkowego prowadzonej przez Google Ventures i obecnie opracowuje narzędzie, które będzie dostarczać wysokiej jakości wideo, które użytkownicy mogliby dostosowywać i edytować.

Cameron podzielił się również szczegółami na temat technologii AI Odyssey i twierdzi, że została ona zaprojektowana do generowania wideo „klasy Hollywood”. Dyrektor powiedział również, że startup szkolił cztery modele generatywne dla użytkowników, aby przejęli „pełną kontrolę nad podstawowymi warstwami wizualnego opowiadania historii”.

Cameron zwrócił uwagę na problem w istniejących modelach AI text-to-video, którym jest brak narzędzi lub opcji do kontrolowania lub edytowania wyników. „Jako opowiadacz historii masz niewielkie możliwości kierowania swoim otoczeniem lub postaciami, lub iterowania drobnych szczegółów ujęcia, aż będzie idealne. Potrzebne są bardziej wydajne modele” — dodał.

Aby rozwiązać ten problem, firma korzysta z wielu modeli AI, które wygenerują pojedynczą warstwę kompozytowego wideo. Według Camerona cztery modele niezależnie wygenerują geometrię, materiały, oświetlenie i ruch. Te cztery warstwy zostaną wygenerowane jednocześnie na podstawie pojedynczego monitu tekstowego, a następnie połączone, aby zaprezentować ostateczny film.

Firma twierdzi, że użytkownicy będą mieli możliwość konfiguracji każdej warstwy osobno, aby uzyskać większą kontrolę nad wyjściem. Odyssey zintegruje również swoje wyjścia wideo z istniejącymi narzędziami i systemami Hollywood używanymi do generowania efektów wizualnych.

Obecnie model wideo AI jest na wczesnym etapie rozwoju. Nie ma daty premiery modelu AI. Jednak firma podkreśliła, że ​​będzie regularnie publikować aktualizacje dotyczące postępów. Warto zauważyć, że Cameron pracował wcześniej dla Cruise i Voyage, dwóch startupów zajmujących się pojazdami autonomicznymi.

Jeff Hawke, drugi współzałożyciel i dyrektor techniczny firmy, wcześniej pracował jako wiceprezes ds. technologii w Wayve, firmie zajmującej się sztuczną inteligencją, która opracowuje systemy autonomicznej jazdy.


Linki partnerskie mogą być generowane automatycznie – szczegóły znajdziesz w naszym oświadczeniu dotyczącym etyki.



Zrodlo