O GPT-4.5 é o maior modelo já construído pela OpenAI. Fonte: The Verge . |
Um novo estudo do Departamento de Ciência Cognitiva da Universidade da Califórnia, em San Diego, marca um marco no campo da inteligência artificial: o modelo GPT-4.5 da OpenAI alcançou desempenho superior no teste de Turing usando uma abordagem de interação baseada em "personalidade".
Este é considerado o sistema de conversação de IA mais próximo ao humano de todos os tempos, abrindo muitas aplicações potenciais no campo da inteligência social.
O GPT-4.5 é considerado pela OpenAI como "um grande avanço no dimensionamento do pré-treinamento e do pós-treinamento". É o maior modelo já construído pela OpenAI, com tamanho e poder computacional que superam as versões anteriores.
De acordo com a postagem oficial do blog da OpenAI em 27 de fevereiro, o GPT-4.5 começou a ser implementado para usuários do ChatGPT Pro no dia do seu anúncio.
A IA pode enganar os humanos?
O experimento comparou quatro sistemas de IA representativos: o chatbot ELIZA, da década de 1960, o LLaMa-3.1-405B da Meta AI e os GPT-4o e GPT-4.5 da OpenAI. A equipe projetou dois testes independentes com 250 participantes cada, totalizando 500 pessoas de plataformas online como a Prolific. Os participantes tinham diferentes idades, gêneros e níveis de escolaridade para garantir uma amostra diversificada.
![]() |
Tabela comparativa de quatro sistemas típicos de IA. Fonte: AIbase |
O teste usa o formato tradicional de Turing: cada participante conversa por meio de uma interface de texto com dois sujeitos (um humano e uma IA) por 5 minutos e, então, avalia qual deles é humano.
Os resultados foram surpreendentes: o GPT-4.5 atingiu uma taxa de aprovação no teste de Turing de 73%, superando a média humana (60-70%). Esta é a primeira vez que um modelo de IA realmente "passou" no teste de Turing padrão. Já o GPT-4o obteve uma pontuação ligeiramente inferior, o LLaMa-3.1-405B se aproximou ou atingiu o desempenho humano em alguns contextos, e o ELIZA ficou muito aquém.
Capacidade de interagir como um humano
O que diferencia o GPT-4.5 não é apenas sua fluência na linguagem, mas também sua capacidade de expressar emoções e adaptar suas respostas às nuances da comunicação do interlocutor. Muitos participantes o descreveram como "amigável" e "autêntico".
Em particular, quando os usuários parecem confusos ou estressados, o GPT-4.5 pode dar respostas engraçadas ou reconfortantes, fazendo muitos acreditarem que estão conversando com uma pessoa real.
![]() |
Conversa entre dois sujeitos (uma IA e um humano) durante o teste. Foto: UC San Diego . |
Enquanto isso, o LLaMa-3.1-405B, embora tecnicamente impressionante, é menos expressivo e menos adaptável ao contexto do que o GPT-4.5. O GPT-4o, embora poderoso, é inferior em termos de personalização e adaptação à resposta situacional.
O avanço do GPT-4.5 pode abrir uma gama de aplicações práticas, desde tutores virtuais a suporte psicológico e atendimento ao cliente. Mas, à medida que a IA se torna mais humana, distinguir entre realidade e fantasia e regular como a tecnologia é usada se tornará um grande desafio social.
A pesquisa surge em meio a rápidos avanços na IA. O sucesso do GPT-4.5 não é apenas um triunfo técnico para a OpenAI, mas também levanta questões profundas sobre a relação entre humanos e máquinas. Um testador comentou que parecia estar conversando com um amigo — até perceber que eram apenas linhas de código. O diálogo entre humanos e IA pode estar apenas começando.
Fonte: https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html
Comentário (0)