2026-01-22 15:04:39

Anthropic公司在其人工智能模型Claude Opus 4.5的表现超越顶尖人类候选人后，重新设计了面向求职者的居家编程测试。由Tristan Hume领导的AI实验室性能优化团队发现，如果没有现场监考，他们就无法区分最优秀的求职者和AI辅助完成的作业。新测试专注于一个旨在难倒现有AI工具的新型硬件优化问题。Hume还公开了旧版测试，并邀请任何能够超越Claude Opus 4.5的人与公司联系。

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

0/400

暂无评论

热门话题