ClaudeOpus4.5发布：编程能力全球第一，价格降三分之二

未来图灵 2025-11-25 09:57:41

11月25日消息，Anthropic（美国一家人工智能公司）于今日凌晨正式发布Claude Opus 4.5，在SWE-bench Verified测试中以80.9%的准确率超越GPT-5.1和Gemini 3 Pro，登顶全球编程模型榜首。该模型定价大幅下调，输入每百万token 5美元，输出25美元，较上代降价约三分之二。目前已通过Claude app、API及三大主流云平台上线。在真实软件工程测试中，Opus 4.5在规定2小时时限内的编程考试中得分超过了所有参加过该测试的人类候选人。Anthropic研究员Adam Wolff表示："就在明年上半年，软件工程彻底终结了。" 除了编程能力，Opus 4.5在智能体搜索任务上实现突破，在BrowseComp-Plus基准测试中显著提升。在Vending-Bench基准上整体收益比Sonnet 4.5高出29%。新智元报道中指出，一个典型案例显示，当扮演航空公司客服时，Opus 4.5找到了"先升级舱位再修改航班"的合规解决方案，突破了基准测试的预期答案。同步更新的Claude开发者平台新增effort参数，允许开发者在最小化成本与最大化能力间自主选择。在中等effort设定下，输出token使用量减少76%。 Anthropic宣称这是"迄今最稳健、最对齐的模型"，在抵御提示词注入攻击方面取得实质性进展，比任何其他前沿模型都更难被欺骗。 Anthropic内部测试者反馈，Opus 4.5在处理模糊指令和复杂多系统Bug时表现出色，几周前对Sonnet 4.5还近乎不可能的任务现已触手可及。

0 阅读：2

智能共创，共建未来

作者最新文章

1

阿里Q2净利润降52%，云业务收入增34%、AI收入连续9个季度翻倍

2

吴恩达发布论文自动审阅器，ICLR评审达接近人类水平

3

Claude Opus 4.5发布：编程能力全球第一，价格降三分之二

4

英伟达Q3净利润317.67亿美元，黄仁勋回应AI泡沫争议

5

何恺明团队提出JiT方法，让扩散模型直接预测干净图像

6

谷歌正式发布Gemini 3 Pro，多项基准测试表现突出，马斯克奥特曼点赞

7

百度Q3财报首次披露AI业务收入，同比增长超50%

8

前世界首富贝索斯创办Project Prometheus，融资62亿美元进军物理AI

9

Grok 4.1发布即登顶LMArena，思考模式领先Gemini 2.5 Pro达31分

10

字节Seed团队今年流失7位核心成员，乔思远加入Meta

热门分类

科技TOP

1

vivoX300s的爆料也来了，外围规格全部拉满了。6.78英寸144Hz蔡

2

苹果公司近日为其员工送上了一份特殊的“生日礼物”，以此纪念品牌创立50周年。据悉

3

尚界Z7预售价22.98万起，Z7T预售价23.98万起，CLTC续航至高9

4

追觅手机研发首期投入100亿追觅手机开始计划投资100亿，目标到2027年手机团

5

成本压力下，各家都在温和调整3月16日0点，OPPO商城正式开启调价：•一加1

6

苹果变形脸表情火了这个表情看上去不太聪明啊有一股子不聪明又透露着好奇和天真无邪的

7

国家超算互联网免费支持OpenClaw国家超算互联网免费给OpenCla

8

给国内的ai排排座次，感觉有的高了，有的低了，有的太高了，有的太低了。

9

当下高端手机市场同质化严重，各大品牌陷入参数堆砌的内卷怪圈，追觅AURORA手机

10

【OpenAI完成其史上最大融资：OpenAI融资1220亿美元，估值达8520

科技最新文章

1

OPPO官宣了！4月21日19点在成都开「OPPOX哈苏影像新品

2

内存降价原因找到了内存降价无非就以下原因。1.供过于求：厂商生产的内存太多，但

3

CounterpointResearch报告显示，存储价格在2025年第

4

很多人都应该给华为畅享90ProMax道歉！因为不怕不识货，就怕货比货！

5

荣耀X80i开启预售：8+128，19998+256，219912+256，24

6

还在等荣耀X80的朋友，估计要等到8月份了。这款机子最大亮点就是电池做到了

7

鸿蒙Mate80据说可能会出一个小屏6.2尺寸的，单手好握持、3D人脸识别、75

8

这回哈工大出手，动静可闹得太大了！谁能想到，大家热议的麒麟9020芯片其实只是打

9

苹果公司近日为其员工送上了一份特殊的“生日礼物”，以此纪念品牌创立50周年。据悉

10

甲骨文凌晨6点突发裁员3万人突发裁员，打工人该怎么应对真的太揪心了，凌晨突然被