xAI Elona Muska wprowadza funkcję rozumienia obrazu do Grok AI

Elon Musk, założyciel firmy xAI zajmującej się sztuczną inteligencją (AI), ogłosił w poniedziałek nową funkcję dla Groka. Wewnętrzny chatbot AI otrzymuje teraz funkcję rozumienia obrazu, która pozwala mu przetwarzać i analizować zawartość obrazu. Użytkownicy mogą teraz przesyłać obraz i na jego podstawie zadawać AI pytania. Warto zauważyć, że xAI wypuściło w sierpniu model Grok-2 AI. Firma ogłosiła wówczas, że model sztucznej inteligencji wkrótce będzie obsługiwał różne modalności.

Grok AI zyskuje zdolność rozumienia obrazu

w post na X (wcześniej znanym jako Twitter) oficjalny uchwyt Groka ogłosił nową możliwość rozumienia obrazu dla chatbota AI. Rozumienie obrazu, zwane także widzeniem komputerowym, umożliwia systemowi sztucznej inteligencji przeglądanie i przetwarzanie danych wizualnych zawartych w obrazie lub filmie. Obecnie ta funkcja jest dostępna tylko w przypadku obrazów statycznych.

Piżmo także wysłane o nowej funkcji, podkreślając, że chatbot AI może przeprowadzić głębszą analizę obrazu, a nawet wyjaśnić znaczenie wizualnego żartu. Dzieląc się przykładem, miliarder poprosił Groka o wyjaśnienie żartu na obrazku. Sztuczna inteligencja była w stanie wyjaśnić założenia żartu, zwrot akcji i wizualny knebel.

Jednak wizja komputerowa nie jest nową funkcją systemów AI i prawie każdy większy model AI oferuje tę funkcję, w tym Gemini, ChatGPT, Copilot, Claude i inne. Użytkownik X podkreślił to i wyraził obawy, że w Groku wciąż brakuje wielu podstawowych funkcji.

w komentarz do postu Muska użytkownik stwierdził, że chatbot AI nadal nie ma możliwości przesyłania plików i generowania obrazów. Przedsiębiorca-miliarder odpowiedział: „Nie na długo. Robimy to w ciągu miesięcy, co innym zajęło lata. Możliwości te mogą zostać dodane do Groka w najbliższej przyszłości.

W sierpniu firma xAI wypuściła modele Grok-2 i Grok-2 Mini AI jako aktualizację pilotażowej wersji modelu dużego języka (LLM). Obydwa modele są dostępne w chatbocie Grok dla użytkowników X Premium i X Premium+. Firma twierdziła, że ​​przewyższa zarówno modele Claude 2.5 Sonnet, jak i GPT-4 Turbo AI.

Zrodlo