No evento anual TechXchange da IBM, a empresa anunciou seu modelo de IA mais avançado até o momento, o Granite 3.0. Os modelos de linguagem Granite de terceira geração da IBM superam ou igualam modelos de tamanho semelhante de fornecedores líderes em diversos benchmarks acadêmicos e da indústria, demonstrando desempenho robusto, transparência e segurança.

A IBM apresenta seu modelo de IA mais avançado até o momento, o Granite 3.0.
Em linha com o compromisso da empresa com a IA de código aberto, os modelos da Granite são lançados sob a licença permissiva Apache 2.0, o que os torna únicos na combinação de desempenho, flexibilidade e autonomia que oferecem aos clientes corporativos e à comunidade em geral.
Os novos modelos de linguagem Granite 3.0 8B e 2B foram projetados como modelos "convencionais" para IA empresarial, oferecendo alto desempenho em tarefas como Geração Aumentada por Recuperação (RAG), classificação, sumarização, extração de entidades e uso de ferramentas. Esses modelos compactos e flexíveis foram desenvolvidos para serem ajustados com dados corporativos e integrados perfeitamente em diversos ambientes ou fluxos de trabalho de negócios.
Embora muitos modelos de linguagem de grande porte (LLMs) sejam treinados com dados disponíveis publicamente, a vasta maioria dos dados corporativos permanece inexplorada. Ao combinar um modelo Granite de pequeno porte com dados corporativos, especificamente usando a revolucionária técnica de alinhamento InstructLab — que a IBM e a Red Hat apresentaram em maio — a IBM acredita que as empresas podem alcançar desempenho específico para tarefas equivalente ao de modelos maiores a uma fração do custo (com base em custos de 3 a 23 vezes menores do que os de grandes modelos de ponta em algumas provas de conceito iniciais).
Modelo de IA Granite 3.0.
O lançamento do Granite 3.0 reafirma o compromisso da IBM com a transparência, segurança e confiança em produtos de IA. O relatório técnico e o guia de uso responsável do Granite 3.0 fornecem uma descrição dos conjuntos de dados usados para treinar esses modelos, detalhes das etapas de filtragem, limpeza e curadoria aplicadas e resultados abrangentes sobre o desempenho do modelo nos principais benchmarks acadêmicos e empresariais.
Os modelos “Granite 3.0” são de código aberto, semelhantes a outras versões da família Granite AI da IBM. Essa abordagem difere da de concorrentes como a Microsoft, que cobra dos clientes pelo acesso aos modelos. Em contrapartida, a IBM oferece uma ferramenta paga chamada WatsonX, que executa os modelos em data centers após sua personalização.
Diversas variantes dos novos modelos Granite estão disponíveis para uso comercial a partir de hoje na plataforma Watsonx. Alguns desses modelos também estarão disponíveis no conjunto de ferramentas de software da Nvidia, permitindo que as empresas incorporem modelos de IA.
Os novos modelos Granite foram treinados usando unidades de processamento gráfico (GPUs) H100 da Nvidia, líder em chips de IA, afirmou Dario Gil, diretor de pesquisa da IBM.
(Segundo a IBM e a Reuters)
Fonte: https://www.baogiaothong.vn/ibm-phat-hanh-moi-ai-hinh-cho-doanh-nghiep-uu-viet-hon-microsoft-192241021144242992.htm






Comentário (0)