Anthropic przedstawia ulepszony model sztucznej inteligencji Claude 3.5 Sonnet z możliwością wykonywania zadań na komputerach PC

We wtorek firma Anthropic wprowadziła dwa nowe modele sztucznej inteligencji (AI) i nową funkcję sztucznej inteligencji. Najważniejszym wprowadzeniem jest ulepszona wersja Claude 3.5 Sonnet, która ma zapewniać lepsze wyniki testów porównawczych w różnych kategoriach. Nowy 3.5 Sonnet otrzymuje także nową funkcję nazwaną Computer Use, która pozwoli mu rozumieć komputery i wchodzić z nimi w interakcję, zasadniczo pozwalając mu na kontrolowanie i wykonywanie zadań na komputerach PC. Ponadto firma zajmująca się sztuczną inteligencją ogłosiła także Claude 3.5 Haiku, następcę Claude 3 Haiku.

Wprowadzono ulepszony sonet Claude 3.5 do użytku z komputerem

W newsroomie postFirma Anthropic ogłosiła ulepszoną wersję Claude 3.5 Sonnet, która oferuje lepszą wydajność w porównaniu do modelu AI wydanego w czerwcu. Firma zajmująca się sztuczną inteligencją stwierdziła, że ​​nowy model przewyższa ChatGPT-4o i Gemini 1.5 Pro w testach porównawczych, takich jak pytania i odpowiedzi Google-Proof na poziomie absolwentów (GPQA), Massive Multitask Language Understanding (MMLU) Pro i HumanEval skupiony na kodowaniu.

Jednak najbardziej znaczącą poprawę odnotowano w dwóch konkretnych testach porównawczych — Software Engineering Benchmark (SWE), który wzrósł z 33,4 procent do 49 procent, oraz Tool-Agent-User (TAU), który wzrósł z 62,6 procent do 69,2 proc. Obydwa te testy porównawcze odnoszą się do wydajności agenta AI.

Ta funkcja agenta AI jest istotna, ponieważ firma Anthropic wprowadziła nową funkcję Computer Use, która umożliwia modelom AI kontrolowanie i wykonywanie zadań na komputerach PC. Obecnie ta funkcja jest dostępna za pośrednictwem interfejsu programowania aplikacji (API), który działa tylko w systemie Claude 3.5 Sonnet.

Dzięki obsłudze komputera Claude uczy się ogólnych umiejętności obsługi komputera. Dzięki specjalistycznemu oprogramowaniu może imitować naciśnięcia klawiszy, kliknięcia przycisków i ruchy kursora. Dodając go do istniejących możliwości widzenia komputerowego modelu AI, Claude 3.5 Sonnet może zobaczyć, co dzieje się na ekranie i przetwarzać informacje w celu wykonania określonych zadań. Ta funkcja będzie działać w oparciu o monity przekazywane AI.

Na przykład użytkownicy mogą poprosić model wielkojęzyczny (LLM) o rezerwację biletów na stronie internetowej, wypełnienie wniosku, a nawet pobranie i zainstalowanie aplikacji. Chociaż istnieją już wyspecjalizowane narzędzia, które mogą zautomatyzować niektóre zadania komputera PC, narzędzie ogólnego przeznaczenia, które działa na podpowiedziach w języku naturalnym, jest znaczącym kamieniem milowym w technologii generatywnej sztucznej inteligencji.

Anthropic przyznaje jednak, że ta zdolność jest wciąż w początkowej fazie i istnieją pewne ograniczenia. „Niektóre czynności, które ludzie wykonują bez wysiłku – przewijanie, przeciąganie, powiększanie – obecnie stanowią wyzwanie dla Claude’a” – podkreśliła firma. Na razie zaleca się, aby programiści używali tej możliwości wyłącznie do zadań o niskim ryzyku.

Dzięki możliwościom zautomatyzowanego sterowania komputerowego istnieją obawy, czy model sztucznej inteligencji można zaprojektować tak, aby wykonywał szkodliwe i nielegalne działania. Firma nie ujawniła na razie żadnych szczegółów na temat bezpieczeństwa modelu AI i bezpieczeństwa użytkowników. Warto zauważyć, że ulepszony Claude 3.5 Sonnet jest dostępny dla wszystkich użytkowników, a programiści mogą wykorzystywać te możliwości za pośrednictwem Anthropic API, Amazon Bedrock i Vertex AI Google Cloud.

Ogłoszono Claude 3.5 Haiku

Kolejną ważną zapowiedzią było zaprezentowanie Claude 3.5 Haiku. Dla kontekstu Haiku to najtańsza i najszybsza seria modeli AI oferowana przez Anthropic. Firma zajmująca się sztuczną inteligencją twierdzi obecnie, że możliwości następcy Claude 3 Haiku przewyższają Claude 3 Opus, poprzedni flagowy model firmy. Oznacza to, że użytkownicy mogą teraz uzyskać dostęp do potężnego modelu sztucznej inteligencji w znacznie niższej cenie.

Claude 3.5 Haiku zostanie wydany jeszcze w tym miesiącu na różnych platformach, w tym na firmowym API, Amazon Bedrock i Vertex AI Google Cloud. Początkowo będzie dostępny jako model tekstowy, a później zostanie zaktualizowany, aby akceptować obrazy jako dane wejściowe.

Zrodlo