Gemini 1.5 Flash-8B z najniższym kosztem tokena wśród rodziny Gemini już dostępny

Gemini 1.5 Flash-8B, najnowszy członek rodziny modeli sztucznej inteligencji (AI) Gemini, jest już ogólnie dostępny do użytku produkcyjnego. W czwartek Google ogłosiło ogólną dostępność modelu, podkreślając, że jest to mniejsza i szybsza wersja Gemini 1.5 Flash, która została zaprezentowana na Google I/O. Ze względu na szybkość, wnioskowanie o niskim opóźnieniu i bardziej wydajne generowanie danych wyjściowych. Co ważniejsze, technologiczny gigant stwierdził, że model Flash-8B AI to „najniższy koszt w przeliczeniu na inteligencję spośród wszystkich modeli Gemini”.

Gemini 1.5 Flash-8B już ogólnie dostępny

W deweloperze wpis na blogugigant technologiczny z Mountain View szczegółowo opisał nowy model sztucznej inteligencji. Gemini 1.5 Flash-8B został wydestylowany z modelu Gemini 1.5 Flash AI, który skupiał się na szybszym przetwarzaniu i bardziej wydajnym generowaniu mocy wyjściowej. Firma twierdzi teraz, że Google DeepMind opracował w ciągu ostatnich kilku miesięcy tę jeszcze mniejszą i szybszą wersję modelu AI.

Pomimo tego, że jest mniejszym modelem, technologiczny gigant twierdzi, że „prawie dorównuje” wydajnością modelowi 1.5 Flash w wielu testach porównawczych. Niektóre z nich obejmują czat, transkrypcję i tłumaczenie na język o długim kontekście.

Jedną z głównych zalet modelu AI jest jego efektywność cenowa. Google powiedział, że Gemini 1.5 Flash-8B będzie oferował najniższą cenę tokena w rodzinie Gemini. Programiści będą musieli zapłacić 0,15 dolara (około 12,5 rupii) za milion tokenów wyjściowych, 0,0375 dolara (około 3 rupii) za milion tokenów wejściowych i 0,01 dolara (około 0,8 rupii) za milion tokenów w przypadku podpowiedzi w pamięci podręcznej.

Dodatkowo Google podwaja limity szybkości modelu AI 1.5 Flash-8B. Teraz programiści mogą wysyłać do 4000 żądań na minutę (RPM) podczas korzystania z tego modelu. Uzasadniając tę ​​decyzję, technologiczny gigant stwierdził, że model nadaje się do prostych zadań o dużej objętości. Programiści, którzy chcą wypróbować model, mogą to zrobić bezpłatnie za pośrednictwem Google AI Studio i Gemini API.

Zrodlo