Tijdens IBM's jaarlijkse TechXchange-evenement kondigde het bedrijf zijn meest geavanceerde AI-model tot nu toe aan: Granite 3.0. IBM's vlaggenschip, de Granite-taalmodellen van de derde generatie, presteert beter of even goed als vergelijkbare modellen van toonaangevende modelleveranciers in diverse academische en industriële benchmarks, wat robuuste prestaties, transparantie en veiligheid aantoont.

IBM onthult zijn meest geavanceerde AI-model tot nu toe: Granite 3.0.
In lijn met de toewijding van het bedrijf aan open source AI, worden Granite-modellen uitgebracht onder de permissieve Apache 2.0-licentie. Hierdoor zijn ze uniek in de combinatie van prestaties, flexibiliteit en autonomie die ze bieden aan zakelijke klanten en de community als geheel.
De nieuwe Granite 3.0 8B- en 2B-taalmodellen zijn ontworpen als "mainstream" modellen voor AI voor bedrijven en leveren krachtige prestaties voor taken zoals Retrieval Augmented Generation (RAG), classificatie, samenvatting, entiteitsextractie en toolgebruik. Deze compacte, flexibele modellen zijn ontworpen om te worden afgestemd op bedrijfsgegevens en naadloos te integreren in diverse bedrijfsomgevingen of workflows.
Hoewel veel grote taalmodellen (LLM's) worden getraind met openbaar beschikbare data, blijft het overgrote deel van de bedrijfsdata onbenut. Door een klein Granite-model te combineren met bedrijfsdata, met name met behulp van de revolutionaire afstemmingstechniek InstructLab – die IBM en RedHat in mei introduceerden – gelooft IBM dat bedrijven taakspecifieke prestaties kunnen behalen die vergelijkbaar zijn met die van grotere modellen, maar dan tegen een fractie van de kosten (gebaseerd op een bereik van 3 tot 23 keer lagere kosten dan grote frontiermodellen in sommige vroege proofs of concept).
Granite 3.0 AI-model.
De release van Granite 3.0 bevestigt IBM's toewijding aan het creëren van transparantie, veiligheid en vertrouwen in AI-producten. Het technische rapport en de handleiding voor verantwoord gebruik van Granite 3.0 bieden een beschrijving van de datasets die zijn gebruikt om deze modellen te trainen, details over de toegepaste filter-, opschonings- en curatiestappen, en uitgebreide resultaten over de modelprestaties in belangrijke academische en zakelijke benchmarks.
De "Granite 3.0"-modellen zijn open source, vergelijkbaar met andere versies van IBM's Granite AI-familie. Deze aanpak verschilt van die van concurrenten zoals Microsoft, die klanten geld vragen voor toegang tot de modellen. In ruil daarvoor biedt IBM een betaalde tool genaamd Watsonx aan, die de modellen in datacenters laat draaien nadat ze zijn aangepast.
Verschillende varianten van de nieuwe Granite-modellen zijn vanaf vandaag beschikbaar voor commercieel gebruik op het Watsonx-platform. Sommige van deze modellen zullen ook beschikbaar zijn op Nvidia's softwaretoolkit, waardoor bedrijven AI-modellen kunnen integreren.
De nieuwe Granite-modellen zijn getraind met behulp van H100 grafische verwerkingseenheden (GPU's) van Nvidia, een leider op het gebied van AI-chips, aldus Dario Gil, directeur onderzoek bij IBM.
(Volgens IBM, Reuters)
Bron: https://www.baogiaothong.vn/ibm-phat-hanh-moi-ai-hinh-cho-doanh-nghiep-uu-viet-hon-microsoft-192241021144242992.htm
Reactie (0)