Anthropic wprowadza obsługę obrazów PDF za pomocą modelu AI Claude 3.5 Sonnet

W piątek firma Anthropic udostępniła kolejną nową funkcję sztucznej inteligencji (AI) dla swojego chatbota Claude. Ta funkcja, nazwana rozpoznawaniem obrazów PDF, pozwala teraz Claudeowi przeglądać i przetwarzać obrazy osadzone w plikach PDF, w tym wykresy i grafiki. Ta funkcja została dodana do niedawno wydanego modelu Claude 3.5 Sonnet AI. Firma twierdzi, że ta umiejętność pozwoli chatbotowi dokładnie zrozumieć złożone dokumenty i zapewnić lepszą analizę danych. Interfejs pakowania aplikacji Anthropic (API) obsługuje również dane wejściowe w formacie PDF. Ta funkcja jest dostępna w wersji beta.

Anthropic publikuje zrozumienie obrazu PDF dla Claude’a

W jego wsparciu dokumentyAnthropic szczegółowo opisał nową funkcję obsługi plików PDF. Do wersji Claude 3.5 Sonnet 20241022 dodano funkcję rozumienia obrazów w formacie PDF, która może przetwarzać obrazy w formacie PDF, a także obsługiwać dane wejściowe w formacie PDF.

Dzieląc pierwszą funkcję, Claude może teraz przeglądać i przetwarzać obrazy, wykresy i grafikę dodane do pliku PDF w celu przeprowadzenia głębszej analizy dokumentu. Po zakończeniu użytkownicy mogą zadawać AI zapytania dotyczące konkretnych obrazów, a ona może udzielić odpowiedzi, podając odpowiednie informacje.

Do tej pory Claude akceptował obrazy jako dane wejściowe i mógł odpowiadać na zapytania na ich temat, jednak nie mógł przetwarzać obrazów dołączonych do dokumentu. Dzięki tej funkcji Anthropic umożliwia teraz użytkownikom uzyskiwanie bardziej szczegółowych odpowiedzi na temat plików PDF. Ta funkcja jest prawdopodobnie skierowana do użytkowników chatbota w przedsiębiorstwach, którzy używają jej do analizy dokumentów sprzedażowych i marketingowych, a także innych tego typu plików.

Claude 3.5 Sonnet akceptuje teraz także pliki PDF jako dane wejściowe, co oznacza, że ​​użytkownicy mogą teraz bezpośrednio przesyłać pliki PDF i umożliwiać użytkownikom zadawanie pytań na ich temat. Dzięki temu możliwości Claude’a są na równi z NotebookLM firmy Google, który jest dedykowaną platformą dla plików PDF i innych typów plików.

Obecnie maksymalny rozmiar pliku PDF przesłanego do Claude może wynosić 32 MB, a maksymalna liczba stron wynosi 1000. Ponadto chatbot nie może przetwarzać plików PDF chronionych hasłem lub zaszyfrowanych. Anthropic wkrótce udostępni tę funkcję w Amazon Bedrock i Google Vertex AI.

Zrodlo