Anthropic 的新模型 Claude Mythos 预览的官方基准测试已经公布。我们一直习惯于看见 AI 的编码能力,而 Mythos 将这一点推进到了一个既令人难以置信、又相当令人毛骨悚然的层面。



GATE SQUARE ✅ 上的最新独家币与市场更新 关注我吧 🔥💰💵 #GateSquareAprilPostingChallenge

作为开源圈中被公认为最安全的操作系统之一,OpenBSD 里,这个模型发现了一个已有 27 年历史的零日漏洞——这个漏洞在过去二十多年的时间里,曾一直躲过全球顶尖的人类安全研究员的视线,直到现在才被发现。甚至在 Linux 内核和 Windows 这类巨型生态系统中,这个 AI 模型也能在瞬间找到成千上万的安全漏洞。

但有趣的是,Anthropic 现在决定不把这款模型立刻发布给普通大众。原因在于它的网络安全攻击能力,或说进攻型能力,强得足以让它一旦落入错误之手就可能引发严重的数字灾难。公司承认,这个模型的自主推理能力比以往任何模型都要锋利得多,比如 (Opus 4.6)。它不仅能发现漏洞,还能立刻把这些漏洞用起来,写出可执行的利用代码,从而怎样接管整个系统也能做到“一夜之间就写出来”。

那么,我们能不能使用这种强大的 AI 呢?答案是:目前还不行。Anthropic 启动了一个名为 Project Glasswing 的特殊防御性计划,只向包括谷歌、微软、亚马逊和英伟达在内的 40 家可信机构开放访问。目的只有一个:在危险黑客拿到这项技术之前,用 AI 来为互联网的关键基础设施,或像银行和医疗保健这样的敏感代码库提供安全保障。
查看原文
post-image
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论