På IBMs årlige TechXchange-arrangement annonserte selskapet sin mest avanserte AI-modell hittil, Granite 3.0. IBMs tredjegenerasjons flaggskipspråkmodeller, Granite, overgår eller er på nivå med modeller i samme størrelse fra ledende modellleverandører på tvers av flere akademiske og industrielle standarder, og demonstrerer robust ytelse, åpenhet og sikkerhet.

IBM avduker sin mest avanserte AI-modell hittil, Granite 3.0.
I tråd med selskapets forpliktelse til åpen kildekode for kunstig intelligens, utgis Granite-modeller under den permissive Apache 2.0-lisensen, noe som gjør dem unike i kombinasjonen av ytelse, fleksibilitet og autonomi de tilbyr bedriftskunder og samfunnet generelt.
De nye språkmodellene Granite 3.0 8B og 2B er utformet som «vanlige» modeller for bedrifts-AI, og leverer sterk ytelse for oppgaver som Retrieval Augmented Generation (RAG), klassifisering, oppsummering, enhetsutvinning og verktøybruk. Disse kompakte og fleksible modellene er utformet for å finjusteres med bedriftsdata og integreres sømløst på tvers av en rekke forretningsmiljøer eller arbeidsflyter.
Selv om mange store språkmodeller (LLM-er) trenes på offentlig tilgjengelige data, forblir de aller fleste bedriftsdata uutnyttet. Ved å kombinere en liten Granite-modell med bedriftsdata, spesielt ved å bruke den revolusjonerende justeringsteknikken InstructLab – som IBM og RedHat introduserte i mai – mener IBM at bedrifter kan oppnå oppgavespesifikk ytelse på nivå med større modeller til en brøkdel av kostnaden (basert på et spekter på 3–23 ganger lavere kostnader enn store frontmodeller i noen tidlige konseptbevis).
Granite 3.0 AI-modell.
Granite 3.0-utgivelsen bekrefter IBMs forpliktelse til å bygge åpenhet, sikkerhet og tillit til AI-produkter. Den tekniske rapporten og veiledningen for ansvarlig bruk av Granite 3.0 gir en beskrivelse av datasettene som brukes til å trene disse modellene, detaljer om filtrerings-, rengjørings- og kurateringstrinnene som er brukt, og omfattende resultater om modellytelse på tvers av viktige akademiske og bedriftsmessige benchmarks.
«Granite 3.0»-modellene er åpen kildekode, i likhet med andre versjoner av IBMs Granite AI-familie. Denne tilnærmingen skiller seg fra konkurrenter som Microsoft, som tar betalt for tilgang til modellene. Til gjengjeld tilbyr IBM et betalt verktøy kalt Watsonx som kjører modellene inne i datasentre etter at de er tilpasset.
Flere varianter av de nye Granite-modellene er tilgjengelige for kommersiell bruk fra i dag på Watsonx-plattformen. Noen av disse modellene vil også være tilgjengelige på Nvidias programvareverktøysett, slik at bedrifter kan integrere AI-modeller.
De nye Granite-modellene ble trent ved hjelp av H100 grafikkprosessorer (GPU-er) fra Nvidia, en leder innen AI-brikker, sa Dario Gil, forskningsdirektør hos IBM.
(Ifølge IBM og Reuters)
[annonse_2]
Kilde: https://www.baogiaothong.vn/ibm-phat-hanh-moi-ai-hinh-cho-doanh-nghiep-uu-viet-hon-microsoft-192241021144242992.htm
Kommentar (0)