Poucos parâmetros, muitos dados

O PaLM 2, o mais recente modelo de linguagem de grande escala (LLM) do Google, anunciado na semana passada, utiliza quase cinco vezes mais dados de treinamento do que seu antecessor de 2022, permitindo realizar programação, matemática e criação de conteúdo mais avançadas.

Na conferência Google I/O Developers Conference, a gigante das buscas apresentou o PaLM 2 – um modelo de linguagem treinado com 3,6 trilhões de tokens. Esses tokens são sequências de palavras – os blocos de construção usados para treinar o modelo de linguagem a prever a próxima palavra.

A versão anterior do PaLM foi lançada em 2022 e teve 780 bilhões de tokens emitidos.

Na semana passada, durante o evento Google I/O, o CEO do Google, Sundar Pichai, apresentou o PaLM 2, o mais recente modelo de linguagem de grande porte da empresa.

Embora o Google tenha alardeado sua capacidade em IA em buscas, e-mail, processamento de texto e planilhas, a empresa tem se mostrado relutante em revelar o tamanho ou os detalhes de seus conjuntos de dados de treinamento. A OpenAI também manteve em segredo os detalhes de sua mais recente especificação de treinamento de LLM, o GPT-4.

As empresas de tecnologia atribuem esse motivo à natureza competitiva de seus negócios. Tanto o Google quanto a OpenAI estão em uma corrida para atrair usuários com chatbots em vez de mecanismos de busca tradicionais.

Compacto, potente e econômico.

O Google afirma que o PaLM 2 é menor que seus antecessores, sendo treinado com 340 bilhões de parâmetros em comparação com os 540 bilhões da versão anterior. Isso demonstra que a tecnologia da empresa está se tornando mais eficiente na execução de tarefas complexas.

Para alcançar esse objetivo, o PaLM 2 utiliza uma nova técnica chamada "otimização computacional estendida", que proporciona "melhor desempenho geral, incluindo inferência mais rápida com menos parâmetros, reduzindo a sobrecarga".

O mais recente modelo de IA de linguagem do Google, treinado em mais de 100 idiomas, está executando uma variedade de tarefas para 25 recursos e produtos, incluindo o chatbot experimental Bard. O PaLM 2 está disponível em quatro versões com base no tamanho, da menor para a maior: Gecko, Otter, Bison e Unicorn.

De acordo com documentação pública, o PaLM 2 é mais poderoso do que qualquer modelo existente. O LlaMA do Facebook, lançado em fevereiro, foi treinado com 1,4 trilhão de tokens. Enquanto isso, a OpenAI divulgou publicamente o tamanho dos dados de treinamento do ChatGPT, uma versão do GPT-3, com 300 bilhões de tokens.

A explosão de aplicações de IA gerou controvérsia em torno da tecnologia. No início deste ano, El Mahdi El Mhamdi, cientista sênior do Google Research, renunciou em protesto contra a falta de transparência da gigante das buscas.

Esta semana, o CEO da OpenAI, Sam Altman, também testemunhou perante a subcomissão judiciária do Senado dos EUA sobre privacidade e tecnologia no contexto da crescente popularidade da IA, onde o "pai" do ChatGPT concordou com os legisladores de que novas regulamentações são necessárias para governar a IA.

(Segundo a CNBC)

Fonte