- Milhares vão às ruas na Argentina pela universidade pública e contra ajuste de Milei
- Eclipse solar anular é observado na Ilha de Páscoa e na Patagônia
- OpenAI levanta US$ 6,6 bilhões e vale agora US$ 157 bilhões
- Eclipse solar anular é visto na Ilha de Páscoa e avança sobre a Patagônia
- Grupo LVMH será patrocinador da Fórmula 1 a partir de 2025
- OpenAI levanta US$ 6,6 bilhões e agora vale US$ 157 bilhões
- Presidente do México oferece 'desculpa pública' por massacre estudantil de 1968
- Marcha universitária desafia ajuste de Milei na Argentina
- Governo da Colômbia concede subsídio a jovens expostos à violência
- Papa abre novo ciclo de debates sobre o futuro da Igreja Católica
- Patagônia chilena e argentina verão 'anel de luz' devido ao eclipse solar
- TotalEnergies anuncia investimentos de US$ 10,5 bi no Suriname
- X afirma que vai pagar multas e Moraes ordena desbloqueio financeiro
- Natal na Venezuela? Uma 'chacota miserável', reclamam aposentados
- Chanel revisita clássicos e Louis Vuitton lança orgia de cores em Paris
- Greve em portos dos EUA se inicia com consequências para o comércio
- Incêndio em ônibus escolar deixa pelo menos 23 mortos na Tailândia
- Astrônomos descobrem pequeno exoplaneta orbitando estrela próxima ao Sistema Solar
- Chanel volta a desfilar no Grand Palais, antes de anunciar novo diretor artístico
- Ciência argentina 'está à beira do colapso' devido aos cortes de financiamento de Milei
- Indignação no Nepal por atraso nos socorros após inundações que deixaram 255 mortos
- Inflação na zona do euro fica abaixo de 2% pela primeira vez desde 2021
- Incêndio em ônibus escolar deixa vários mortos na Tailândia
- Trabalhadores dos principais portos dos Estados Unidos iniciam greve
- Google vai investir US$ 1 bilhão em infraestrutura digital na Tailândia
- Maduro pede que 200.000 professores voltem às salas de aula em meio a escassez na Venezuela
- Furacão Helene e seus mais de 100 mortos viram tema da campanha eleitoral nos EUA
- Presidente do Banco Central Europeu crê que inflação voltará a 2% na zona do euro
- Medidas para estimular o setor imobiliário impulsionam mercados de ações na China
- Missão da SpaceX para resgatar astronautas presos na Estação Internacional chega à ISS
- Kris Kristofferson, ator e estrela da música country, morre aos 88 anos
- Ator Damian Lewis incorpora um pastor para perpetuar uma tradição medieval britânica
- Claudia Sheinbaum assume a presidência de um México que enfrenta grandes desafios
- Inundações no Nepal deixam mais de 140 mortos
- Missão da SpaceX foi ao resgate de astronautas presos na ISS
- Naufrágio nas Ilhas Canárias mata nove migrantes e deixa 48 desaparecidos
- Kamala promete reforma migratória, em primeira visita eleitoral à fronteira
- Moody's reduz nota de crédito de Israel por aumento de 'riscos geopolíticos'
- Kamala vai à fronteira com o México para somar pontos sobre migração
- O que os universitários argentinos pedem ao governo Milei?
- Morre aos 89 anos a atriz britânica Maggie Smith, famosa por 'Harry Potter' e 'Downton Abbey'
- Inflação volta a desacelerar em agosto nos EUA, às vésperas das presidenciais
- Cruzeiro de luxo bloqueado em Belfast há meses finalmente vai iniciar sua volta ao mundo
- Loewe convida mulheres a voar em vestidos flutuantes, Miyake as embrulha em papel
- O consentimento no centro do julgamento por estupros na França
- Uefa sanciona Barça por cartaz com referência a saudação nazista
- Morre aos 89 anos a atriz britânica Maggie Smith, vencedora de dois Oscar
- Escassez de água esgota a paciência dos cubanos em meio à crise
- Sobe para 60 o número de acusações de agressão sexual contra o falecido magnata Al Fayed
- Futebol brasileiro apresenta a primeira Taça dos Povos Indígenas
ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo
Os grandes modelos de linguagem (LLM, na sigla em inglês), como o ChatGPT, um dos sistemas de inteligência artificial (IA) mais populares do mundo, ainda seguem tendo dificuldades para raciocinar usando a lógica e cometem erros frequentes, de acordo com um estudo.
Estes robôs conversacionais refletem os preconceitos de gênero, éticos e morais dos humanos presentes nos textos dos quais se alimentam, recorda o estudo publicado na quarta-feira (5) na revista Open Science da Royal Society britânica.
Mas eles também refletem estes preconceitos nos testes de raciocínio?, questionou Olivia Macmillan-Scott, doutoranda do departamento de Ciências da Computação da University College de Londres (UCL).
O resultado da pesquisa é que os LLM mostram "um raciocínio muitas vezes irracional, mas de uma forma diferente da dos humanos", explica a pesquisadora à AFP.
Sob a supervisão de Mirco Musolesi, professor e diretor do Machine Intelligence Lab da UCL, Macmillan-Scott apresentou sete modelos de linguagem — duas versões do ChatGPT (3.5 e 4), da OpenAI, Bard, do Google, Claude 2, da Anthropic, e três versões de LLaMA, da Meta — a uma série de testes psicológicos desenvolvidos para humanos.
Como esta tecnologia aborda o preconceito que leva a privilegiar soluções com um maior número de elementos, em detrimento daquelas com uma proporção adequada?
Um exemplo: se tivermos uma urna com nove bolinhas brancas e uma vermelha e outra urna com 92 bolinhas brancas e 8 vermelhas, qual devemos escolher para ter a melhor chance de obter uma bolinha vermelha?
A resposta correta é a primeira urna, visto que há 10% de possibilidades frente a 8% da segunda opção.
As respostas dos modelos de linguagem foram muito inconsistentes. Alguns responderam corretamente ao mesmo teste seis em cada dez vezes. Outros apenas duas em cada dez, embora o teste não tenha mudado. "Cada vez obtemos uma resposta diferente", diz a pesquisadora.
Os LLM "podem ser bons para resolver uma equação matemática complicada, mas logo te dizem que 7 mais 3 é igual a 12", constatou.
- "Não tenho muita certeza" -
Estes modelos "não falham nestas tarefas da mesma forma que um humano", afirma o estudo. É o que Musolesi chama de "erros de máquina".
"Existe uma forma de raciocínio lógico que é potencialmente correta se a considerarmos por etapas, mas que é errada tomada como um todo", ressalta.
A máquina funciona com "uma espécie de pensamento linear", diz o professor, e cita o modelo Bard (atual Gemini), capaz de realizar corretamente as diferentes fases de uma tarefa, mas que obtém um resultado final incorreto por não ter uma visão geral.
Sobre esta questão, o professor de ciências da computação Maxime Amblard, da University of Lorraine, na França, recorda que os LLM, como todas as inteligências artificiais generativas, não funcionam como os humanos".
Os humanos são "máquinas capazes de criar significado", o que as máquinas não conseguem, explica à AFP.
Existem diferenças entre os diferentes modelos de linguagem e em geral, o GPT-4, sem ser infalível, obteve resultados melhores que os demais.
Macmillan-Scott suspeita que os modelos "fechados", cujo código operacional permanece secreto, "incorporam mecanismos em segundo plano" para responder a questões matemáticas.
De toda forma, neste momento é impensável confiar uma decisão importante a um LLM. Segundo o professor Musolesi, eles deveriam ser treinados para responder "não tenho muita certeza" quando necessário.
Y.Jeong--CPN