Anthropic Claude desafia candidatos com teste que supera até IA avançada

Ó Claude antrópico está criando um curioso dilema para recrutadores de tecnologia. Desde 2024, a equipe de otimização de desempenho da Anthropic vem utilizando testes técnicos para avaliar candidatos a emprego, mas agora enfrenta um problema peculiar: suas próprias criações de IA estão tornando esses testes obsoletos ao superarem candidatos humanos.

De acordo com Tristão Humelíder da equipe, cada nova versão do assistente de IA da empresa tem forçado uma completa reformulação dos testes aplicados. A situação chegou a um ponto crítico quando, sob as mesmas condições e limites de tempo, o Fechar Trabalho 4 conseguiu desempenho superior ao da maioria dos candidatos humanos avaliados.

Mesmo esse cenário ainda permitia identificar os candidatos excepcionais, até que o Fechar Trabalho 4.5 elevou o nível novamente, igualando-se até mesmo aos melhores talentos humanos que participaram do processo seletivo. Essa evolução criou um verdadeiro paradoxo para a equipe de recrutamento.

Ilustração gráfica com várias silhuetas de cabeça sobre fundo terracota, representando redes neurais e inteligência artificial — Representação visual da inteligência artificial Anthropic Claude com conexões neurais em destaque.

“Sob as restrições do teste para fazer em casa, não tínhamos mais como distinguir entre a produção dos nossos melhores candidatos e a do nosso modelo mais capaz”, explicou Hume em publicação no blog oficial da empresa.

A ironia não passa despercebida: os mesmos laboratórios de IA que desenvolvem ferramentas cada vez mais sofisticadas agora precisam lidar com o potencial uso delas para trapacear em seus próprios processos seletivos. Sem supervisão presencial, tornou-se praticamente impossível garantir que candidatos não estejam utilizando assistentes de IA para resolver os desafios propostos.

O problema da trapaça com IA já causa estragos em escolas e universidades ao redor do mundo, como reportado pelo Wall Street Journal. No entanto, a Anthropic encontra-se em posição única para enfrentar esse desafio, justamente por conhecer profundamente as capacidades e limitações de seus modelos.

A solução encontrada por Hume foi desenvolver um novo teste menos focado em otimização de hardware e mais em aspectos para os quais as IAs atuais ainda não foram adequadamente treinadas, tornando-o suficientemente inovador para confundir até mesmo assistentes avançados como o próprio Claude.

Como parte da publicação, a Anthropic compartilhou o teste original e lançou um desafio aos leitores: “Se você conseguir superar o Opus 4.5, adoraríamos ouvir de você” – uma estratégia que funciona simultaneamente como recrutamento e benchmark para avaliar as limitações de seus modelos mais recentes.

Você também pode gostar dos artigos abaixo:

Anthropic fecha acordo bilionário com Google Cloud e terá acesso a 1 milhão de chips de IA

Anthropic cria agentes de IA que auditam outras IAs; entenda

Acesse agora a Loja Podicas no Mercado Livre e descubra produtos incríveis para o dia a dia.

Fonte original

Anthropic Claude desafia candidatos com teste que supera até IA avançada

Você também pode gostar dos artigos abaixo:

Podicas

POSTS RELACIONADOS

Google prefere guardar seus chips de IA a vendê-los: decisão revela o que realmente importa na corrida pela AGI

a indústria da IA depende mais dos cientistas chineses do que muita gente imagina

A estratégia bilionária do Google que transforma concorrentes em fonte de lucro

Brasil avança no uso de inteligência artificial, mas ranking mundial mostra quem está na frente

Um monitor LG começou a exibir anúncios no Windows, e a Microsoft resolveu agir

EUA querem poder desligar as IAs mais poderosas do mundo; entenda o motivo

Deixe um comentário Cancelar resposta

Escorpiões venenosos: como diferenciar as espécies perigosas e proteger sua família do risco.

Se você tem caixas de ovos de papelão sem uso, você tem um tesouro em casa: por que e para que usá-las para organizar gavetas e pequenas peças

Google prefere guardar seus chips de IA a vendê-los: decisão revela o que realmente importa na corrida pela AGI

Como eliminar o cheiro de cachorro e de mofo em apartamentos fechados no inverno usando truques simples, segundo especialistas

Como limpar a tela da TV ou do computador sem deixar marcas de gordura e sem correr o risco de manchar o display, segundo técnicos

SOBRE

LINKS RÁPIDOS

ÚLTIMOS POSTS

Escorpiões venenosos: como diferenciar as espécies perigosas e proteger sua família do risco.

Se você tem caixas de ovos de papelão sem uso, você tem um tesouro em casa: por que e para que usá-las para organizar gavetas e pequenas peças