A Anthropic, após o seu modelo de inteligência artificial Claude Opus 4.5 superar os melhores candidatos humanos, redesenhou o teste de programação em casa voltado para candidatos a emprego. A equipa de otimização de desempenho do laboratório de IA, liderada por Tristan Hume, descobriu que, sem vigilância presencial, eles não conseguiam distinguir os candidatos mais qualificados de trabalhos realizados com assistência de IA. O novo teste foca numa nova questão de otimização de hardware, destinada a derrotar as ferramentas de IA existentes. Hume também divulgou o teste antigo e convidou qualquer pessoa capaz de superar o Claude Opus 4.5 a entrar em contacto com a empresa.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
A Anthropic, após o seu modelo de inteligência artificial Claude Opus 4.5 superar os melhores candidatos humanos, redesenhou o teste de programação em casa voltado para candidatos a emprego. A equipa de otimização de desempenho do laboratório de IA, liderada por Tristan Hume, descobriu que, sem vigilância presencial, eles não conseguiam distinguir os candidatos mais qualificados de trabalhos realizados com assistência de IA. O novo teste foca numa nova questão de otimização de hardware, destinada a derrotar as ferramentas de IA existentes. Hume também divulgou o teste antigo e convidou qualquer pessoa capaz de superar o Claude Opus 4.5 a entrar em contacto com a empresa.