Vid IBMs årliga TechXchange-evenemang presenterade företaget sin hittills mest avancerade AI-modell, Granite 3.0. IBMs tredje generationens flaggskeppsmodeller inom Granite-språket överträffar eller är lika stora som modeller i liknande storlek från ledande modellleverantörer inom flera akademiska och industriella riktmärken, och visar på robust prestanda, transparens och säkerhet.

IBM presenterar sin hittills mest avancerade AI-modell, Granite 3.0.
I linje med företagets engagemang för öppen källkod för AI släpps Granite-modeller under den tillåtande Apache 2.0-licensen, vilket gör dem unika i den kombination av prestanda, flexibilitet och autonomi som de erbjuder företagskunder och communityn i stort.
De nya språkmodellerna Granite 3.0 8B och 2B är utformade som "mainstream"-modeller för företags-AI och levererar stark prestanda för uppgifter som Retrieval Augmented Generation (RAG), klassificering, sammanfattning, entitetsextraktion och verktygsanvändning. Dessa kompakta, flexibla modeller är utformade för att finjusteras med företagsdata och integreras sömlöst i en mängd olika affärsmiljöer eller arbetsflöden.
Medan många stora språkmodeller (LLM) tränas på offentligt tillgängliga data, förblir den stora majoriteten av företagsdata outnyttjad. Genom att kombinera en liten Granite-modell med företagsdata, specifikt med hjälp av den revolutionerande justeringstekniken InstructLab – som IBM och RedHat introducerade i maj – tror IBM att företag kan uppnå uppgiftsspecifik prestanda i nivå med större modeller till en bråkdel av kostnaden (baserat på ett intervall på 3x–23x lägre kostnader än stora frontmodeller i vissa tidiga koncepttest).
Granite 3.0 AI-modell.
Granite 3.0-versionen bekräftar IBMs engagemang för att bygga transparens, säkerhet och förtroende för AI-produkter. Den tekniska rapporten och guiden för ansvarsfull användning av Granite 3.0 ger en beskrivning av de datamängder som används för att träna dessa modeller, detaljer om de filtrerings-, rensnings- och kureringssteg som tillämpats, samt omfattande resultat om modellprestanda över viktiga akademiska och företagsmässiga riktmärken.
Modellerna ”Granite 3.0” är öppen källkod, liknande andra versioner av IBMs Granite AI-familj. Denna metod skiljer sig från konkurrenter som Microsoft, som tar betalt av kunder för åtkomst till modellerna. I gengäld erbjuder IBM ett betalt verktyg som heter Watsonx som kör modellerna inuti datacenter efter att de har anpassats.
Flera varianter av de nya Granite-modellerna finns tillgängliga för kommersiellt bruk från och med idag på Watsonx-plattformen. Några av dessa modeller kommer också att finnas tillgängliga i Nvidias programvaruverktyg, vilket gör det möjligt för företag att integrera AI-modeller.
De nya Granite-modellerna tränades med hjälp av H100-grafikprocessorer (GPU:er) från Nvidia, en ledare inom AI-chips, säger Dario Gil, forskningschef på IBM.
(Enligt IBM och Reuters)
[annons_2]
Källa: https://www.baogiaothong.vn/ibm-phat-hanh-moi-ai-hinh-cho-doanh-nghiep-uu-viet-hon-microsoft-192241021144242992.htm
Kommentar (0)