Az IBM éves TechXchange rendezvényén a vállalat bejelentette eddigi legfejlettebb mesterséges intelligencia modelljét, a Granite 3.0-t. Az IBM harmadik generációs zászlóshajójának számító Granite nyelvi modelljei több akadémiai és iparági referenciaértéken is felülmúlják vagy megegyeznek a vezető modellgyártók hasonló méretű modelljeivel, robusztus teljesítményt, átláthatóságot és biztonságot demonstrálva.

Az IBM bemutatta eddigi legfejlettebb mesterséges intelligencia modelljét, a Granite 3.0-t.
A vállalat nyílt forráskódú mesterséges intelligencia iránti elkötelezettségével összhangban a Granite modellek az engedékeny Apache 2.0 licenc alatt kerülnek kiadásra, ami egyedülállóvá teszi őket a teljesítmény, a rugalmasság és az autonómia kombinációjában, amelyet a vállalati ügyfelek és a tágabb közösség számára kínálnak.
Az új Granite 3.0 8B és 2B nyelvi modelleket a vállalati mesterséges intelligencia „alapvető” modelljeiként tervezték, és kiváló teljesítményt nyújtanak olyan feladatokhoz, mint a Retrieval Augmented Generation (RAG), az osztályozás, az összegzés, az entitások kinyerése és az eszközhasználat. Ezek a kompakt, rugalmas modellek úgy lettek kialakítva, hogy finomhangolhatók legyenek a vállalati adatokkal, és zökkenőmentesen integrálhatók legyenek a különféle üzleti környezetekbe vagy munkafolyamatokba.
Míg számos nagyméretű nyelvi modellt (LLM) nyilvánosan elérhető adatokon tanítanak, a vállalati adatok túlnyomó többsége továbbra is kiaknázatlan marad. Az IBM úgy véli, hogy egy kis Granite modell és a vállalati adatok kombinálásával – konkrétan a forradalmian új InstructLab illesztési technika használatával – – amelyet az IBM és a RedHat májusban vezetett be – a vállalatok a nagyobb modellekkel egyenértékű feladatspecifikus teljesítményt érhetnek el a költségek töredékéért (a korai koncepcióbizonyításokban szereplő, a nagyméretű határmodellekhez képest 3-23-szor alacsonyabb költségek alapján).
Gránit 3.0 mesterséges intelligencia modell.
A Granite 3.0 kiadása megerősíti az IBM elkötelezettségét az AI-termékek átláthatóságának, biztonságának és bizalmának kiépítése iránt. A Granite 3.0 technikai jelentése és a felelős használati útmutató leírásokat tartalmaz a modellek betanításához használt adatkészletekről, részleteket az alkalmazott szűrési, tisztítási és kurációs lépésekről, valamint átfogó eredményeket a modellek teljesítményéről a kulcsfontosságú akadémiai és vállalati referenciaértékek alapján.
A „Granite 3.0” modellek nyílt forráskódúak, hasonlóan az IBM Granite AI családjának más verzióihoz. Ez a megközelítés eltér a versenytársaktól, például a Microsofttól, amelyek díjat számítanak fel az ügyfeleknek a modellekhez való hozzáférésért. Cserébe az IBM egy fizetős eszközt kínál, a Watsonx-ot, amely a modelleket az adatközpontokban futtatja a testreszabás után.
Az új Granite modellek számos változata ma elérhető kereskedelmi forgalomban a Watsonx platformon. Ezen modellek némelyike az Nvidia szoftveres eszközkészletében is elérhető lesz, lehetővé téve a vállalkozások számára, hogy mesterséges intelligencia modelleket építsenek be.
Az új Granite modelleket az Nvidia, a mesterséges intelligencia chipek egyik vezető cégének H100 grafikus feldolgozóegységeivel (GPU-ival) képezték ki – mondta Dario Gil, az IBM kutatási igazgatója.
(Az IBM és a Reuters szerint)
[hirdetés_2]
Forrás: https://www.baogiaothong.vn/ibm-phat-hanh-mo-hinh-ai-moi-cho-doanh-nghiep-uu-viet-hon-microsoft-192241021144242992.htm
Hozzászólás (0)