Home Technologia Zaawansowany generator obrazów Imagen 3 AI firmy Google jest teraz dostępny bezpłatnie...

Technologia

Zaawansowany generator obrazów Imagen 3 AI firmy Google jest teraz dostępny bezpłatnie w serwisie Gemini – jak to działa

11 October 2024

Najnowszy i najpotężniejszy model obrazowania generatywnego AI firmy Google, Image 3, jest teraz dostępny dla każdego. Tak, nawet jeśli nie wykupiłeś płatnego poziomu Gemini. Google twierdzi, że Imagen 3 to jak dotąd model generowania obrazu „najwyższej jakości”, zapewniający jeszcze wyższy stopień fotorealizmu, lepsze wskazówki i wiele więcej. Oto wszystko, co musisz wiedzieć.

Przeczytaj także: Premiera iPhone’a SE 4 coraz bliżej: 5 dużych ulepszeń w ofercie Apple ze średniej półki

Model Imagen 3 Dla wszystkich korzystających z Google Gemini: Oto, jak uzyskać do niego dostęp

Mówiąc najprościej, aby uzyskać dostęp do Imagen 3, wystarczy odwiedzić stronę internetową Gemini lub otworzyć aplikację Gemini na kompatybilnym urządzeniu, a następnie wpisać szczegółowy monit opisujący, czego chcesz od obrazów. Przykładowa zachęta może brzmieć: „Tajemniczy, futurystyczny kosmita stojący w świecącym, bioluminescencyjnym lesie pod niebem pełnym wirujących galaktyk i odległych gwiazd. Obcy ma gładką, metaliczną skórę z opalizującymi wzorami, które zmieniają kolory w miarę ruchu. Jego duże, refleksyjne oczy błyszczą inteligencją, a misterne tatuaże delikatnie mienią się na ciele.

Po przesłaniu monitu uruchamia się model Google Imagen 3 i generuje obraz w ciągu kilku sekund. Teraz możesz po prostu pobrać obraz, a jeśli coś Ci się w nim nie podoba, poproś Gemini o stworzenie wariacji z nowymi szczegółami.

Przeczytaj także: X wprowadza nowy model płatności, aby zwiększyć zaangażowanie użytkowników premium i przychody twórców

Google twierdzi, że jego sztuczna inteligencja lepiej rozumie teraz podpowiedzi

Bądźmy realistami: nie każdy będzie przesyłał doskonałe i pełne szczegółów instrukcje, dlatego Google pracuje nad lepszym zrozumieniem instrukcji AI. „Znacznie poprawiliśmy zdolność Imagen 3 do rozumienia podpowiedzi, co pomaga modelom generować szeroką gamę stylów wizualnych i wychwytywać drobne szczegóły z dłuższych podpowiedzi” – twierdzi Google.

Co jeszcze ciekawsze, model ten rozumie subtelne niuanse, takie jak kąt kamery i kompozycja, dzięki czemu można poinstruować go, aby renderował obraz pod określonym kątem lub z określonego obiektywu. Ponadto Google twierdzi, że lepiej renderuje tekst, dzięki czemu można szybko i łatwo tworzyć obrazy z tekstem.

Przeczytaj także: Ratan Tata był kiedyś zatrudniony przez IBM i użył swojego urządzenia do stworzenia CV na potrzeby pracy w…

Zrodlo