Anthropic 在 Claude Mythos 更广泛发布前扩大 Project Glasswing 的访问范围
序言
Anthropic 正在增加参与 Project Glasswing 的组织数量,这是其用于评估和保护先进 Claude Mythos 人工智能模型的受控项目。本文摘要说明了扩展内容、Anthropic 为何扩大访问所给出的理由,以及围绕该模型的更广泛安全与政策背景。目的是客观呈现发生的变化、被新增的参与者,以及随着更强大 AI 模型接近部署,对网络安全与公共安全可能产生的影响。
重点摘要
Anthropic 正在向 Project Glasswing 新增大约 150 个组织,以帮助在 Claude Mythos 广泛公开发布之前识别并修复漏洞。新合作伙伴来自关键基础设施领域,例如电力、水务、医疗、通信与硬件,并且在获得访问权限之前必须满足 Anthropic 的安全要求。公司表示,此举旨在随着具 AI 能力的攻击技术演进,增强防御方的能力。
主体内容
Anthropic 已宣布大幅扩展 Project Glasswing,这是其针对 Claude Mythos 模型的受控访问测试项目。公司正邀请大约 150 家额外组织参与。Project Glasswing 的设计目的是让经审查的科技公司、安全研究人员与政府机构探测 Mythos 的漏洞、异常行为与潜在利用路径,以便在更广泛发布之前修复问题。此扩展被呈现为 Anthropic 在准备更广泛提供 Mythos 级能力时采取的谨慎推出策略的一部分。
新获准的组织代表被识别为关键基础设施的部门:电力、水务、医疗、电信与硬件。Anthropic 强调,许多合作伙伴维护政府与数以亿计终端用户使用的软件;若其代码库被成功攻破,可能造成重大伤害。Anthropic 在公开声明中估计,对于许多合作伙伴而言,大规模攻击可能影响超过 1 亿人,并带来严重的国家与全球安全后果。根据该风险评估,所有新合作伙伴在获得模型访问权限之前,必须先满足公司的安全要求。
Anthropic 表示,这次扩展是在与现有 Glasswing 合作伙伴、安全行业、开源维护者与美国政府利益相关方进行数周合作之后。公司也指出,早期的合作伙伴已经使用 Mythos Preview 揭示了大量漏洞:根据 Anthropic 的说法,严重或危急级别的问题超过 10,000 件。合作伙伴报告的用例包括自动化漏洞识别、建议补丁生成、安全审查协助与预发布测试工作流程。
Claude Mythos 的能力已吸引研究人员与政府机构的关注,他们正在评估其防御效用以及若被滥用时可能带来的风险。独立分析与测试该模型的组织报告了显著结果。例如,有报道指出在测试中模拟的公司网络攻击能以多个自动化步骤完成;某些项目声称该模型帮助识别数百个浏览器漏洞或支持针对硬件的利用链研究。这些演示引发了争议:虽然该模型可以加速防御工作——发现并协助修复缺陷——但也可能降低攻击者设计复杂行动的技术门槛。
Anthropic 将 Project Glasswing 的扩展定位为一项防御措施:公司主张防御方需要访问越来越强大的 AI 工具,以跟上攻击者可能很快获得的相当能力。Anthropic 预计其他开发者会在未来六到十二个月内推出 Mythos 级模型,并警告那些未来发布可能不会包含相同的安全控制。Anthropic 认为,这一前景增加了现在就装备受信任合作伙伴以发现和修补漏洞的紧迫性。
此公告的时机与 Anthropic 向美国证券交易委员会提交的机密 IPO 申请同步。公司表示计划在完成额外的安全防护措施后“在未来数周”向客户提供 Mythos 级模型。虽然 Anthropic 已公开提供有关 Glasswing 扩展的一些细节,但公司并未立即回应媒体要求进一步评论的请求。
受控扩展也改变了市场与社区对该模型公开可用性的预期。预测市场与其他指标已调整了 Claude Mythos 在本月底前广泛发布的概率,反映投资者与用户基于公司分阶段推出与以安全为先的策略所重新校准的时间表。
从 Anthropic 的公告可以得出几项更广泛的要点。首先,公司做法凸显部署前沿 AI 时的一个常见权衡:在让受信任方早期进行防御性使用的好处与可能被滥用带来的风险之间取得平衡。其次,针对关键基础设施合作伙伴的重点强调了当先进 AI 应用于拥有大量用户系统的软件安全时,特别脆弱且利害关系重大的情形。第三,Anthropic 预计其他团队很快会发布同等能力的模型,这表明模型能力与安全措施的竞赛正在加速。
从政策角度来看,此举强化了在处理可能实质影响国家安全与公共安全的模型时,需要协调的公私部门参与的呼吁。政府与行业利益相关方可能会继续推动透明的防护措施、标准化的风险评估,以及负责任的访问程序,以在降低滥用机会的同时让防御方得以准备。
总之,Anthropic 将 Project Glasswing 扩展至约 150 家额外组织,是其对 Claude Mythos 采取谨慎推出策略的具体步骤。此举既反映了该模型改善防御性网络安全工作的潜力,也反映了对强大生成式 AI 可能被恶意利用的更广泛担忧。随着 Anthropic 朝更广泛发布迈进,Glasswing 的测试与修复成果将受到安全团队、监管机构与广大公众的密切关注。
关键洞见表
| 面向 | 描述 |
|---|---|
| 計划擴展 | Anthropic 正在向 Project Glasswing 新增約 150 家組織,以測試並保護 Claude Mythos。 |
| 參與部門 | 新合作伙伴包括关键基础设施组织:电力、水务、医疗、通信与硬件。 |
| 安全理由 | Anthropic 表示防御方需要有能力的 AI 工具来在更广泛的模型发布之前识别并修补漏洞。 |
| 报告结果 | 早期参与者据称使用 Mythos Preview 发现超过 10,000 件高或危急等级的漏洞并起草修补。 |
| 风险考量 | 虽然对防御方有用,但若未妥善控制,该模型的能力也可能被滥用以促成复杂的网络攻击。 |