No evento anual TechXchange da IBM, a empresa anunciou seu modelo de IA mais avançado até o momento, o Granite 3.0. Os modelos de linguagem Granite de terceira geração da IBM superam ou igualam modelos de tamanho similar de fornecedores líderes em diversos benchmarks acadêmicos e do setor, demonstrando desempenho robusto, transparência e segurança.

A IBM revela seu modelo de IA mais avançado até o momento, o Granite 3.0.
Em linha com o compromisso da empresa com a IA de código aberto, os modelos Granite são lançados sob a licença permissiva Apache 2.0, o que os torna únicos na combinação de desempenho, flexibilidade e autonomia que oferecem aos clientes corporativos e à comunidade em geral.
Os novos modelos de linguagem Granite 3.0 8B e 2B foram projetados como modelos "go-to" para IA empresarial, oferecendo excelente desempenho para tarefas como Geração Aumentada de Recuperação (RAG), classificação, sumarização, extração de entidades e uso de ferramentas. Esses modelos compactos e flexíveis foram projetados para serem ajustados com precisão aos dados corporativos e perfeitamente integrados a uma variedade de ambientes de negócios ou fluxos de trabalho.
Embora muitos modelos de linguagem de grande porte (LLMs) sejam treinados em dados disponíveis publicamente, a grande maioria dos dados corporativos permanece inexplorada. Ao combinar um pequeno modelo Granite com dados corporativos, especificamente usando a revolucionária técnica de alinhamento InstructLab — lançada pela IBM e RedHat em maio — a IBM acredita que as empresas podem alcançar um desempenho específico para tarefas equivalente ao de modelos maiores por uma fração do custo (com base em uma faixa de custos de 3 a 23 vezes menor do que os modelos de fronteira de grande porte em algumas provas de conceito iniciais).
Modelo de IA do Granite 3.0.
O lançamento do Granite 3.0 reafirma o compromisso da IBM em construir transparência, segurança e confiança em produtos de IA. O relatório técnico e o guia de uso responsável do Granite 3.0 fornecem descrições dos conjuntos de dados usados para treinar esses modelos, detalhes sobre as etapas de filtragem, limpeza e curadoria aplicadas, além de resultados abrangentes sobre o desempenho dos modelos em benchmarks acadêmicos e empresariais importantes.
Os modelos "Granite 3.0" são de código aberto, semelhantes a outras versões da família Granite AI da IBM. Essa abordagem difere de concorrentes como a Microsoft, que cobram dos clientes pelo acesso aos modelos. Em troca, a IBM oferece uma ferramenta paga chamada Watsonx, que executa os modelos dentro de data centers após a personalização.
Diversas variantes dos novos modelos Granite estão disponíveis para uso comercial a partir de hoje na plataforma Watsonx. Alguns desses modelos também estarão disponíveis no kit de ferramentas de software da Nvidia, permitindo que empresas incorporem modelos de IA.
Os novos modelos Granite foram treinados usando unidades de processamento gráfico (GPUs) H100 da Nvidia, líder em chips de IA, disse Dario Gil, diretor de pesquisa da IBM.
(De acordo com a IBM e a Reuters)
[anúncio_2]
Fonte: https://www.baogiaothong.vn/ibm-phat-hanh-mo-hinh-ai-moi-cho-doanh-nghiep-uu-viet-hon-microsoft-192241021144242992.htm
Comentário (0)