Meta udostępnia model AI, który może sprawdzić działanie innych modeli AI

Właściciel Facebooka, Meta, powiedział w piątek, że udostępnia serię nowych modeli sztucznej inteligencji ze swojego działu badawczego, w tym „samouka oceniającego”, który może wskazać drogę do mniejszego zaangażowania człowieka w proces rozwoju sztucznej inteligencji.

Wydanie to następuje po wprowadzeniu tego narzędzia przez Meta w sierpniowym artykule, w którym szczegółowo opisano, w jaki sposób opiera się ono na tej samej technice „łańcucha myślenia”, używanej w niedawno wydanych modelach o1 OpenAI, aby umożliwić mu dokonywanie wiarygodnych ocen na temat reakcji modeli.

Technika ta polega na dzieleniu złożonych problemów na mniejsze logiczne kroki i wydaje się poprawiać dokładność odpowiedzi na trudne problemy z przedmiotów takich jak nauki ścisłe, kodowanie i matematyka.

Badacze Meta wykorzystali dane w całości wygenerowane przez sztuczną inteligencję do szkolenia modelu ewaluatora, eliminując również na tym etapie wkład człowieka.

Możliwość wykorzystania sztucznej inteligencji do wiarygodnej oceny sztucznej inteligencji daje wgląd w możliwą ścieżkę budowania autonomicznych agentów sztucznej inteligencji, którzy potrafią uczyć się na własnych błędach, powiedziało agencji Reuters dwóch badaczy Meta odpowiedzialnych za projekt.

Wiele osób zajmujących się sztuczną inteligencją przewiduje, że tacy agenci to asystenci cyfrowi, wystarczająco inteligentni, aby wykonywać szeroki wachlarz zadań bez interwencji człowieka.

Samodoskonalące się modele mogłyby wyeliminować potrzebę stosowania często kosztownego i nieefektywnego procesu stosowanego obecnie, zwanego uczeniem się przez wzmacnianie na podstawie informacji zwrotnej od ludzi, który wymaga wkładu ze strony ludzi piszących, którzy muszą posiadać specjalistyczną wiedzę, aby dokładnie oznaczać dane i weryfikować, czy odpowiadają one na złożone zapytania matematyczne i pisemne są poprawne.

„Mamy nadzieję, że w miarę jak sztuczna inteligencja będzie coraz bardziej nadludzka, będzie coraz lepiej sprawdzała swoje działanie, tak że faktycznie będzie lepsza od przeciętnego człowieka” – powiedział Jason Weston, jeden z badaczy.

„Pomysł bycia samoukiem i umiejętnością samooceny jest w zasadzie kluczowy dla osiągnięcia tego rodzaju nadludzkiego poziomu sztucznej inteligencji” – powiedział.

Inne firmy, w tym Google i Anthropic, również opublikowały badania na temat koncepcji RLAIF, czyli uczenia się przez wzmocnienie na podstawie informacji zwrotnych AI. Jednak w przeciwieństwie do Meta firmy te zwykle nie udostępniają swoich modeli do użytku publicznego.

Inne narzędzia AI opublikowane przez Meta w piątek obejmowały aktualizację firmowego modelu Segment Everything do identyfikacji obrazu, narzędzia, które przyspiesza czas generowania odpowiedzi LLM i zestawy danych, które można wykorzystać do pomocy w odkrywaniu nowych materiałów nieorganicznych.

© Thomson Reuters 2024

Zrodlo