Podczas corocznego wydarzenia TechXchange firmy IBM, firma zaprezentowała swój najbardziej zaawansowany jak dotąd model sztucznej inteligencji – Granite 3.0. Flagowe modele językowe Granite trzeciej generacji firmy IBM przewyższają lub dorównują pod względem wielkości modelom wiodących dostawców modeli w licznych testach akademickich i branżowych, wykazując się solidną wydajnością, przejrzystością i bezpieczeństwem.

IBM przedstawia swój jak dotąd najbardziej zaawansowany model sztucznej inteligencji – Granite 3.0.
Zgodnie z zobowiązaniem firmy do udostępniania kodu źródłowego sztucznej inteligencji, modele Granite są udostępniane na podstawie licencji Apache 2.0, co czyni je wyjątkowymi pod względem połączenia wydajności, elastyczności i autonomii, jakie oferują klientom korporacyjnym i całej społeczności.
Nowe modele językowe Granite 3.0 8B i 2B zostały zaprojektowane jako modele „do zastosowania” w korporacyjnej sztucznej inteligencji, zapewniając wysoką wydajność w takich zadaniach, jak generowanie rozszerzonego wyszukiwania (RAG), klasyfikacja, podsumowania, ekstrakcja encji i korzystanie z narzędzi. Te kompaktowe, elastyczne modele zostały zaprojektowane z myślą o precyzyjnym dostosowaniu do danych przedsiębiorstwa i płynnej integracji w różnych środowiskach biznesowych i przepływach pracy.
Chociaż wiele dużych modeli językowych (LLM) jest trenowanych na danych publicznie dostępnych, zdecydowana większość danych przedsiębiorstwa pozostaje niewykorzystana. Łącząc mały model Granite z danymi przedsiębiorstwa, a konkretnie wykorzystując rewolucyjną technikę dopasowywania InstructLab — wprowadzoną przez IBM i RedHat w maju — IBM uważa, że przedsiębiorstwa mogą osiągnąć wydajność w zakresie zadań porównywalną z większymi modelami, przy znacznie niższych kosztach (w oparciu o zakres kosztów od 3 do 23 razy niższych niż w przypadku dużych modeli granicznych w niektórych wczesnych dowodach koncepcji).
Model sztucznej inteligencji Granite 3.0.
Wersja Granite 3.0 potwierdza zaangażowanie IBM w budowanie przejrzystości, bezpieczeństwa i zaufania do produktów AI. Raport techniczny Granite 3.0 i przewodnik odpowiedzialnego użytkowania zawierają opisy zestawów danych użytych do trenowania tych modeli, szczegółowe informacje na temat zastosowanych kroków filtrowania, czyszczenia i kuracji oraz kompleksowe wyniki dotyczące wydajności modelu w kluczowych testach porównawczych dla środowisk akademickich i przedsiębiorstw.
Modele „Granite 3.0” są oparte na otwartym kodzie źródłowym, podobnie jak inne wersje rodziny Granite AI firmy IBM. To podejście różni się od rozwiązań konkurencji, takich jak Microsoft, które pobierają od klientów opłaty za dostęp do modeli. W zamian IBM oferuje płatne narzędzie o nazwie Watsonx, które uruchamia modele w centrach danych po ich dostosowaniu.
Kilka wariantów nowych modeli Granite jest dostępnych do użytku komercyjnego od dziś na platformie Watsonx. Niektóre z tych modeli będą również dostępne w zestawie narzędzi programowych firmy Nvidia, umożliwiając firmom wdrażanie modeli AI.
Nowe modele Granite zostały wytrenowane przy użyciu procesorów graficznych (GPU) H100 firmy Nvidia, lidera w produkcji układów scalonych AI, powiedział Dario Gil, dyrektor ds. badań w IBM.
(Według IBM, Reuters)
Źródło: https://www.baogiaothong.vn/ibm-phat-hanh-mo-hinh-ai-moi-cho-doanh-nghiep-uu-viet-hon-microsoft-192241021144242992.htm
Komentarz (0)