Firmy robiące znaczące postępy w indyjskich LLM – Tech Mahindra, Gnani.ai, Sarvam

Oficjalnie wkroczyliśmy w erę sztucznej inteligencji, czyli AI. Sztuczna inteligencja wkroczy w nasze życie w wielkim stylu, a Open AI ChatGPT jest jednym z najlepszych przykładów sztucznej inteligencji. Modele wielkojęzykowe (LLM) stanowią sedno trwającej rewolucji w zakresie sztucznej inteligencji. Jednak większość głównych modeli językowych z Zachodu oferuje ograniczoną obsługę języków indyjskich. Ale to się wkrótce zmieni wraz z poważnym rozwojem skupiającym się obecnie na regionalnych LLM i językach indyjskich.

Bhashini

Bhashini, inicjatywa rządu indyjskiego w zakresie tłumaczeń sztucznej inteligencji, której celem jest przełamanie barier językowych w Indiach. Obsługuje 22 języki, ponad 300 modeli AI i ma ponad 500 000 pobrań aplikacji mobilnych. AI4Bharat, laboratorium badawcze w IIT Madras, zajmuje się rozwojem technologii języka indyjskiego poprzez opracowywanie zbiorów danych, narzędzi, modeli i aplikacji typu open source. Ich pionierska praca w tej dziedzinie została doceniona na wiodących konferencjach międzynarodowych. Ich główny wkład obejmuje projekty takie jak IndicCorp, BPCC, Shrutilipi, Kathbath, IndicBERT, IndicTrans, IndicXlit, IndicWav2Vec, Indic Whisper i TTS.

Przeczytaj także: OpenAI o1 „Truskawkowa” sztuczna inteligencja może myśleć jak ludzie, ale dlaczego jej nazwa pochodzi od owocu?

Sarvam AI

Sarvam AI, startup w przestrzeni generatywnej sztucznej inteligencji założony przez Viveka Raghavana i Pratyusha Kumara i wspierany przez Lightspeed, Peak XV Partners i Khosla Ventures, opracowuje generatywne modele sztucznej inteligencji, koncentrując się na językach indyjskich. Sarvam AI ma na celu poprawę dokładności generatywnych aplikacji AI w Indiach przy niższych kosztach Niedawno Sarvam AI wprowadził model Sarvam 2B o 2 miliardach parametrów, który jest oprogramowaniem typu open source i jest dostępny na platformie Hugging Face. Sarvam AI twierdzi, że jego model jest znacznie wydajniejszy w przypadku języków indyjskich w porównaniu z Meta Llama 3.1, Google Gemma 2 i GPT-4o.

Techniczny Mahindra

Firma Tech Mahindra ogłosiła niedawno projekt Indus, skupiający się na rozwoju od podstaw największego indyjskiego LLM. Kunal Purohit, prezes Tech Mahindra Next Gen Services powiedział: „Indie jako kraj tradycyjnie były konsumentem technologii; jednakże obecnie podejmujemy aktywne kroki w celu przekształcenia się w producenta technologii. Ta zmiana nadała pozytywny impuls i poczyniliśmy znaczne postępy dzięki projektom Indus i Indic LLM. Od początku naszym celem było stworzenie od podstaw modelu podstawowego. Dzięki Project Indus osiągnęliśmy pierwszy kamień milowy w postaci stworzenia podstawowego modelu open source. Naszym celem było zaspokojenie potrzeb różnych dialektów używanych w całych Indiach. Pomyślnie uruchomiliśmy Indus, model zawierający 1,2 miliarda parametrów, wyszkolony w języku hindi i w 37 dialektach, umożliwiający użytkownikom zadawanie pytań w ich rodzimym dialekcie i otrzymywanie dokładnych odpowiedzi. Model ten zapewnia płynne połączenie pomiędzy markami i osobami w tych dialektach.

Przeczytaj także: Google pomoże Ci teraz zamienić Twoje notatki w podcasty, wprowadzając nową funkcję podsumowań audio opartą na sztucznej inteligencji

Gnani.ai

Inną firmą stosującą interesujące podejście jest Gnani.ai, która opracowała SLM, czyli Small Language Models, do zastosowań specyficznych dla branży. Firma inwestowała w sztuczną inteligencję na długo przed tym, zanim stała się ona głównym nurtem. Opatentowała kilka innowacji, a do inwestorów zalicza Samsung Ventures i Infoedge Ventures dzięki własnej wiedzy specjalistycznej w zakresie wielu języków indyjskich. Ganesh Gopalan, współzałożyciel i dyrektor generalny Gnani.ai, uważa, że ​​sztuczna inteligencja może rozwiązać kilka kluczowych wyzwań w Indiach, takich jak edukacja podstawowa, opieka zdrowotna nad matkami i nie tylko. Uważa, że ​​ledwo dotarliśmy do celu, jeśli chodzi o wykorzystanie mocy sztucznej inteligencji. Dodaje, że odgłosy słyszane w Indiach bardzo różnią się od dźwięków, jakie słychać gdziekolwiek indziej na świecie, niezależnie od tego, czy słychać je w autorikszy, czy w pociągu.

Projekt Vaani

Project Vaani, wspólna inicjatywa IISc Bangalore, ARTPARK i Google, ma na celu zapewnienie programistom dostępu do ponad 14 000 godzin danych mowy w 59 językach zebranych z 80 okręgów w całych Indiach. Google kontynuuje tę inicjatywę, inwestując w nowy projekt znany jako Morni i opracowując modele sztucznej inteligencji obsługujące prawie 125 języków indyjskich.

Chociaż możliwy jest lokalny rozwój i szkolenie modeli sztucznej inteligencji, nadal w dużym stopniu polega się na procesorach graficznych NVIDIA i brakuje odpowiedniego sprzętu. Niedawno rząd Telangany nawiązał współpracę z Yotta Data Services, aby uruchomić największy w Indiach superkomputer AI wyposażony w 25 000 wydajnych procesorów graficznych. Kampus AI Cloud Data Center będzie wyposażony w dedykowaną infrastrukturę chmurową GPU, oferującą dostęp do wysokowydajnych zasobów obliczeniowych zasilanych przez około 4000 procesorów graficznych NVIDIA H100/H200, z możliwością rozszerzenia w przyszłości do ponad 25 000 procesorów graficznych. Te procesory graficzne będą połączone szybką siecią. Infrastruktura ta będzie dostępna dla start-upów, instytucji edukacyjnych, laboratoriów badawczych, przedsiębiorstw i organizacji rządowych.

Przeczytaj także: WhatsApp ulepszy Meta AI i doda więcej opcji głosowych, aby poprawić spersonalizowaną interakcję z użytkownikiem

Boty głosowe stały się znaczącym zastosowaniem sztucznej inteligencji w Indiach, w dużej mierze napędzane szybkim rozwojem branży fintech. Oczywiste jest, że sztuczna inteligencja stanie się powszechna w całym kraju, a wiele wdrożeń będzie pełniło rolę pilota w celu ulepszenia istniejących procesów. Warto zauważyć, że rozwój modeli języka indyjskiego wymaga znacznie więcej zasobów niż rozwój modeli języka angielskiego. Pomimo tych wyzwań Indie staną się jednym z największych rynków powszechnego przyjęcia sztucznej inteligencji.

Zrodlo