Google podobno pracuje nad ulepszeniem możliwości generowania obrazów przez chatbota Gemini. Według nowego raportu gigant technologiczny z Mountain View dodaje funkcję edycji obrazów w trybie inline do bota sztucznej inteligencji (AI). Funkcję tę dostrzeżono w najnowszej wersji beta aplikacji Google i chociaż podobno jest ona opracowywana na smartfony, nie jest jasne, czy będzie dostępna również w kliencie internetowym. Warto zauważyć, że platforma Microsoft Designer oferuje już funkcję edycji wbudowanej obsługiwaną przez Copilot.
Wbudowana edycja obrazu Gemini
Według organu Androida raportnową funkcję wykryto w wersji beta aplikacji Google na Androida w wersji 15.40.31.29. Dostrzeżono to w publikacji podczas procesu usuwania pakietu aplikacji na Androida (APK). Osoby, które zarejestrowały się w programie beta Google, nie będą mogły go przetestować, ponieważ nie jest to widoczna funkcja.
Jak dotąd edycja obrazu za pomocą Gemini była trudnym zadaniem. Dzieje się tak dlatego, że jeśli użytkownikowi nie podoba się jakiś szczegół obrazu, będzie musiał dodać więcej szczegółów w kolejnym pytaniu, aby wygenerować kolejną iterację. Jednak następna iteracja może usunąć dobre elementy z poprzedniego obrazu i wprowadzić nowe aberracje. Nie było sposobu, aby zachować dobre części i wyeliminować te niezbyt dobre.
Może się to jednak zmienić wraz z wprowadzeniem nowej funkcji. Na podstawie demonstracji wideo udostępnionych przez publikację, funkcja działa w oparciu o kombinację dwóch interakcji użytkownika. Po wygenerowaniu obrazu użytkownik może zaznaczyć jego część i dodać monit, a Gemini zmieni tylko tę część obrazu, pozostawiając resztę nietkniętą.
Jednak, jak użytkownicy mogą zobaczyć w demonstracji wideo, funkcja jest jeszcze daleka od ukończenia. W kilku przypadkach nadal zmieniał cały obraz, mimo że otrzymał polecenie zmiany tylko jego części. Możliwe jednak, że problemy te zostaną rozwiązane po udostępnieniu tej funkcji użytkownikom.