Podczas corocznego wydarzenia TechXchange firmy IBM, firma ogłosiła swój najbardziej zaawansowany jak dotąd model sztucznej inteligencji – Granite 3.0. Modele języka rdzeniowego Granite trzeciej generacji firmy IBM mogą przewyższać lub dorównywać pod względem wielkości modelom wiodących dostawców modeli w szeregu testów akademickich i branżowych, wykazując się solidną wydajnością, transparentnością i bezpieczeństwem.

Firma IBM zaprezentowała swój jak dotąd najbardziej zaawansowany model sztucznej inteligencji – Granite 3.0.
Zgodnie z zaangażowaniem firmy w rozwój sztucznej inteligencji opartej na otwartym kodzie źródłowym, modele Granite są udostępniane na licencji Apache 2.0, co czyni je wyjątkowymi pod względem połączenia wydajności, elastyczności i autonomii, jakie oferują klientom korporacyjnym i szerszej społeczności.
Nowe modele językowe Granite 3.0 8B i 2B zostały zaprojektowane jako „podstawowe” modele dla sztucznej inteligencji w przedsiębiorstwach, zapewniając wysoką wydajność w takich zadaniach, jak generowanie rozszerzonego wyszukiwania (RAG), klasyfikacja, podsumowania, ekstrakcja encji i narzędzia. Te kompaktowe, elastyczne modele zostały zaprojektowane z myślą o precyzyjnym dostosowaniu do danych przedsiębiorstwa i płynnej integracji w różnych środowiskach biznesowych i przepływach pracy.
Chociaż wiele modeli językowych dużej skali (LLM) jest trenowanych na danych publicznie dostępnych, znaczna część danych przedsiębiorstwa pozostaje niewykorzystana. Łącząc mały model Granite z danymi przedsiębiorstwa, a w szczególności wykorzystując rewolucyjną technikę dopasowania InstructLab – wprowadzoną przez IBM i RedHat w maju – IBM uważa, że firmy mogą osiągnąć wydajność w zakresie zadań porównywalną z większymi modelami, ponosząc znacznie niższe koszty (w oparciu o przedziały kosztów od 3 do 23 razy niższe niż w przypadku modeli granicznych dużej skali w niektórych wczesnych dowodach koncepcji).
Model sztucznej inteligencji Granite 3.0.
Wersja Granite 3.0 potwierdza zaangażowanie IBM w budowanie przejrzystości, bezpieczeństwa i zaufania do swoich produktów AI. Raport techniczny i podręcznik użytkownika Granite 3.0 zawierają rzetelne opisy zestawów danych użytych do trenowania tych modeli, szczegółowe informacje na temat zastosowanych kroków filtrowania, czyszczenia i zarządzania oraz kompleksowe wyniki dotyczące wydajności modelu w porównaniu z głównymi testami porównawczymi akademickimi i korporacyjnymi.
Modele „Granite 3.0” są dostępne na licencji open source, podobnie jak inne wersje z rodziny rozwiązań IBM Granite AI. To podejście różni się od rozwiązań konkurencji, takich jak Microsoft, który pobiera opłaty za dostęp do modeli. W zamian IBM udostępnia płatne narzędzie o nazwie Watsonx, które umożliwia użytkownikom uruchamianie modeli w centrach danych po ich dostosowaniu.
Kilka wariantów nowych modeli Granite jest dostępnych od dziś do użytku komercyjnego na platformie Watsonx. Niektóre z tych modeli będą również dostępne w pakiecie oprogramowania Nvidia, umożliwiając firmom integrację modeli AI.
Dario Gil, dyrektor ds. badań w IBM, powiedział, że nowe modele Granite zostały wytrenowane przy użyciu procesorów graficznych (GPU) Nvidia H100, wiodącej firmy w dziedzinie układów scalonych AI.
(Według IBM, Reuters)
Źródło: https://www.baogiaothong.vn/ibm-phat-hanh-mo-hinh-ai-moi-cho-doanh-nghiep-uu-viet-hon-microsoft-192241021144242992.htm







Komentarz (0)