就在两周前,英伟达刚刚宣布向Anthropic投资100亿美元,这笔钱让Anthropic的估值飙升到3500亿美元。 两家公司都计划在2026年下半年到2027年左右启动上市程序,现在正是证明自己技术实力、争夺市场定价权的关键时刻。
在知识工作能力的评测GDPval-AA 上,Opus 4.6比OpenAI的GPT-5.2高出约144Elo分,比自己的前代Opus 4.5高出190分。这个测试涵盖了金融、法律等领域的实际工作任务,比如制作财务分析报告、起草法律文件、做市场调研等。
在Agent编程评估Terminal-Bench 2.0中取得了最高分,并在“人类最后考试”中领先所有其他前沿模型。 在MRCR v2 8-needle 1M基准测试——大海捞针——中,Opus 4.6得分76%,而Claude Sonnet 4.5只有18.5%。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果