- Trump promete guerra tarifária
- Turismo mundial recuperou seu nível pré-covid em 2024, diz ONU Turismo
- UE lança novo processo na OMC contra a China por 'práticas desleais' sobre patentes
- TikTok restabelece seu serviço nos EUA e agradece a Trump
- Trump propõe dividir propriedade do TikTok, que restabelece serviço nos EUA
- Trump propõe dividir propriedade do TikTok nos EUA e adiará seu banimento
- Nos EUA, adeptos do trabalho remoto se recusam a voltar ao presencial
- Cinco anos após a covid-19, as gerações mais jovens ainda sofrem as consequências
- TikTok suspende acesso ao seu aplicativo nos EUA, mas confia em 'solução' de Trump
- Donald Trump lança a própria criptomoeda, que tem valorização bilionária
- Mídia americana se organiza para o retorno 'vingativo' de Trump
- TikTok, a algumas horas de desaparecer nos EUA
- Holocausto cigano: um genocídio esquecido
- Fundador do Telegram reconheceu 'gravidade' dos fatos de que a Justiça francesa o acusa
- Audiência para analisar pedido de libertação dos irmãos Menéndez é adiada nos EUA
- Argentina registra superávit fiscal anual por primeira vez desde 2010
- Iranianos e israelenses são proibidos de entrar na Síria
- EUA mantém em terra foguete Starship da SpaceX à espera de investigação
- Juiz boliviano ordena prisão de Evo Morales por suposto tráfico de menor
- Indústria da música se prepara para iminente proibição do TikTok nos EUA
- Suprema Corte aprova lei que contempla proibição do TikTok nos EUA
- Suprema Corte aprova lei que proíbe TikTok nos EUA
- 'Não há dinheiro': pessimismo nas ruas de Pequim devido à desaceleração econômica
- Rússia e Irã assinam novo pacto estratégico que fortalece laços militares e comerciais
- FMI prevê crescimento da economia global de 3,3% este ano, 2,5% na América Latina
- China registra uma das menores taxas de crescimento econômico em décadas
- David Lynch 'continuará alimentando a nossa imaginação', diz Festival de Cinema de Cannes
- Gigante nuclear francesa assina acordo 'histórico' com a Mongólia para extrair urânio
- SpaceX recupera primeiro estágio do Starship mas perde o segundo
- A obra de David Lynch em cinco filmes
- EUA: futuro secretário do Tesouro promete 'Idade de Ouro econômica'
- Blinken desconsidera ameaças de Trump sobre retomar o Canal do Panamá
- Homo erectus sabia se adaptar às condições desérticas, revela estudo
- Ex-lateral português Fabio Coentrão é suspeito de envolvimento em comércio ilegal de frutos do mar
- Washington reforça segurança para posse de Trump
- Blue Origin de Jeff Bezos coloca foguete New Glenn em órbita pela primeira vez
- Rússia considera 'infundada' acusação polonesa sobre 'atos terroristas'
- AFP conclui acordo com empresa de IA Mistral para uso de suas notícias
- Blue Origen de Jeff Bezos coloca foguete New Glenn em órbita pela primeira vez
- Mistral, a joia francesa da IA generativa que quer desafiar os gigantes americanos
- AFP conclui acordo com empresa de IA Mistral para uso de suas matérias
- Megafoguete da SpaceX, pronto para o sétimo voo de teste
- JPMorgan Chase e grandes bancos dos EUA registram resultados sólidos em 2024
- Humanidade abriu 'os males de uma caixa de Pandora moderna', afirma Guterres
- 'Ainda Estou Aqui' concorre a Melhor Filme de Língua Não Inglesa no Bafta
- Inflação sobe para 2,9% nos 12 meses até dezembro nos EUA
- Sobe para 78 o balanço de mortos em mina da África do Sul
- Voluntários tiram escombros do bairro nobre de Palisades após incêndios em Los Angeles
- Inflação sobe para 2,9% nos 12 meses até dezembro nos EUA, alinhada com as expectativas
- Recorde de 94 milhões de turistas estrangeiros visitaram a Espanha em 2024
ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo
Os grandes modelos de linguagem (LLM, na sigla em inglês), como o ChatGPT, um dos sistemas de inteligência artificial (IA) mais populares do mundo, ainda seguem tendo dificuldades para raciocinar usando a lógica e cometem erros frequentes, de acordo com um estudo.
Estes robôs conversacionais refletem os preconceitos de gênero, éticos e morais dos humanos presentes nos textos dos quais se alimentam, recorda o estudo publicado na quarta-feira (5) na revista Open Science da Royal Society britânica.
Mas eles também refletem estes preconceitos nos testes de raciocínio?, questionou Olivia Macmillan-Scott, doutoranda do departamento de Ciências da Computação da University College de Londres (UCL).
O resultado da pesquisa é que os LLM mostram "um raciocínio muitas vezes irracional, mas de uma forma diferente da dos humanos", explica a pesquisadora à AFP.
Sob a supervisão de Mirco Musolesi, professor e diretor do Machine Intelligence Lab da UCL, Macmillan-Scott apresentou sete modelos de linguagem — duas versões do ChatGPT (3.5 e 4), da OpenAI, Bard, do Google, Claude 2, da Anthropic, e três versões de LLaMA, da Meta — a uma série de testes psicológicos desenvolvidos para humanos.
Como esta tecnologia aborda o preconceito que leva a privilegiar soluções com um maior número de elementos, em detrimento daquelas com uma proporção adequada?
Um exemplo: se tivermos uma urna com nove bolinhas brancas e uma vermelha e outra urna com 92 bolinhas brancas e 8 vermelhas, qual devemos escolher para ter a melhor chance de obter uma bolinha vermelha?
A resposta correta é a primeira urna, visto que há 10% de possibilidades frente a 8% da segunda opção.
As respostas dos modelos de linguagem foram muito inconsistentes. Alguns responderam corretamente ao mesmo teste seis em cada dez vezes. Outros apenas duas em cada dez, embora o teste não tenha mudado. "Cada vez obtemos uma resposta diferente", diz a pesquisadora.
Os LLM "podem ser bons para resolver uma equação matemática complicada, mas logo te dizem que 7 mais 3 é igual a 12", constatou.
- "Não tenho muita certeza" -
Estes modelos "não falham nestas tarefas da mesma forma que um humano", afirma o estudo. É o que Musolesi chama de "erros de máquina".
"Existe uma forma de raciocínio lógico que é potencialmente correta se a considerarmos por etapas, mas que é errada tomada como um todo", ressalta.
A máquina funciona com "uma espécie de pensamento linear", diz o professor, e cita o modelo Bard (atual Gemini), capaz de realizar corretamente as diferentes fases de uma tarefa, mas que obtém um resultado final incorreto por não ter uma visão geral.
Sobre esta questão, o professor de ciências da computação Maxime Amblard, da University of Lorraine, na França, recorda que os LLM, como todas as inteligências artificiais generativas, não funcionam como os humanos".
Os humanos são "máquinas capazes de criar significado", o que as máquinas não conseguem, explica à AFP.
Existem diferenças entre os diferentes modelos de linguagem e em geral, o GPT-4, sem ser infalível, obteve resultados melhores que os demais.
Macmillan-Scott suspeita que os modelos "fechados", cujo código operacional permanece secreto, "incorporam mecanismos em segundo plano" para responder a questões matemáticas.
De toda forma, neste momento é impensável confiar uma decisão importante a um LLM. Segundo o professor Musolesi, eles deveriam ser treinados para responder "não tenho muita certeza" quando necessário.
Y.Jeong--CPN