Anthropic公司在其人工智能模型Claude Opus 4.5的表现超越顶尖人类候选人后,重新设计了面向求职者的居家编程测试。由Tristan Hume领导的AI实验室性能优化团队发现,如果没有现场监考,他们就无法区分最优秀的求职者和AI辅助完成的作业。新测试专注于一个旨在难倒现有AI工具的新型硬件优化问题。Hume还公开了旧版测试,并邀请任何能够超越Claude Opus 4.5的人与公司联系。

此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言