网易首页 > 网易号 > 正文 申请入驻

深度 | 市场份额翻倍!Anthropic如何用编程“黑科技”逆袭OpenAI

0
分享至

曾几何时,OpenAI 及其 ChatGPT 模型是 AI 编程领域的标杆,其代码生成能力定义了市场预期。然而,近期的市场动态表明,这一格局正经历深刻调整。Anthropic 携其 Claude 系列模型,尤其是 Claude 3.5 及 3.7 Sonnet,正迅速成为该领域不可忽视的关键力量,引发了关于技术路线、市场策略和未来趋势的广泛讨论。

市场风向转变:Anthropic 强势崛起,关键指标亮眼

AI 编程领域的竞争天平正在倾斜。虽然 OpenAI 曾凭借先发优势占据主导,但 Anthropic 这家成立仅4年的公司,正以惊人的速度改变竞争态势。其估值已达615亿美元(E轮投后估值),软件开发与代码生成业务的年化收入在短期内实现十倍级增长。市场份额的变化直观地体现了这一趋势,Anthropic 的份额显著提升 ,从 2023 年的 12% 翻倍至 2024 年的 24%,反而 OpenAI 的市场份额从 50% 缩水至 34%。



一个明确的市场信号是,主流 AI 编程助手 Cursor 在 2024 年 7 月将其默认大模型从 GPT 系列切换至 Claude 3.5 Sonnet,这标志着开发者和工具生态对 Anthropic 技术实力的认可。同时,企业用户需求日益多元化,寻求更灵活、非单一供应商的 AI 解决方案,也为 Anthropic 提供了增长契机。

商业与资本表现:高估值倍数与健康的收入结构

Anthropic 的崛起不仅体现在技术层面,其商业表现和资本吸引力同样值得关注。

融资与估值:2025年3月伊始,Anthropic 就完成了 35 亿美元融资,估值一举飙升至 615 亿美元。这轮融资由 Lightspeed Venture Partners 领投,豪掷 10 亿美元,后面跟着一长串科技与金融界的重量级玩家:亚马逊(累计投资 80 亿美元)、谷歌(累计投资30亿美元)、Salesforce Ventures、Cisco Investments、Fidelity Management & Research Company、General Catalyst、D1 Capital Partners 和 Jane Street。这阵容,堪称科技投资界的“全明星天团”!甚至占有14%股份的谷歌公司都不能享有投票权、董事会席位或董事会观察员权利,证明了Anthropic在融资议价过程中的强势地位。值得注意的是,截至2024年底,Anthropic年 ARR 约为8.75亿美元,估值/收入倍数(约 68.6 倍)显著高于 OpenAI(约 42.4 倍)。

这反映了资本市场对其在企业服务和技术创新方面,特别是编程能力所驱动的增长潜力抱有更高期待。

收入结构: 2024 年,Anthropic 的 ARR 将达 10 亿美元,同比增长 1100%。其中,高达 85% 的收入来源于 API 业务,远超 OpenAI 的 27% 。这表明 Anthropic 在企业级服务市场,尤其是在利用其编程优势赋能开发者和企业方面,已建立起独特的、更具粘性的商业模式。



Claude 技术内核:定义AI编程新标杆

Anthropic 的核心竞争力在于其 Claude 系列模型,特别是 Claude 3.5 及 3.7 Sonnet,它们在 AI 编程领域展现出卓越性能。

●模型创新:Claude 3.7 Sonnet 第一次在业界引入“混合推理”(Hybrid Reasoning)技术,能在快速响应和深度分析(Extended Thinking)间智能切换,结合高达 128,000 token 的“思考预算”,使其在处理复杂编码、数学问题和长文本分析方面表现突出。这种设计可能成为未来高性能模型的标配。

●更长的可靠输出:Claude 3.7 Sonnet 在人工智能编码领域树立了新的里程碑,其单次生成1000至1500行可靠代码的能力超越了Claude 3.5 Sonnet 的200行限制。这一进步得益于更大的输出令牌容量和改进的上下文理解能力,为复杂编程任务的自动化和软件开发效率的提升开辟了新可能性。



  • 性能基准:Claude 在多个权威编程能力基准测试中表现优异。在 LMSYS 维护的,专注于网页应用开发能力的 WebDev Arena 榜单上,Claude 3.7 Sonnet 甫一发布即登顶,大幅领先包括自家 Claude 3.5 Sonnet 在内的所有对手。



在衡量真实世界软件工程能力的 SWE-Bench Verified 测试和需要与用户及工具进行复杂交互的 TAU-bench 测试中,Claude 3.7 Sonnet 同样拔得头筹,超越 GPT-4o 。



LMSYS 的综合 benchmarks 也显示,Claude 3.7 Sonnet 在研究生级推理、编程和多语言任务上优于 GPT-4o。



  • 实测能力: 社区的实际测试进一步印证了 Claude 的强大。例如,使用 p5.js 生成复杂布料模拟效果的代码,Claude 能够快速生成高质量结果。



一位学者甚至拿出自己1986年在 MIT 关于“布料外观建模”的硕士论文对比感叹,过去需要数天的工作,现在AI几分钟就能超越。



挑战生成爆火游戏《Flappy bird》,Claude 3.7 Sonnet一眼完胜o3 mini-high。

游戏中,玩家必须控制一只小鸟,跨越由各种不同长度水管所组成的障碍。

先看Claude 3.7 Sonnet,一次性生成的代码就高度还原了游戏理念:



而高档位推理模式下的o3 mini,只有一个小方块在画面中原地鬼畜,基本看不出游戏的样子。一时间,这一惨烈对比直接将Claude 3.7 Sonnet推上了新的高度。



交互与工作流创新:Artifacts 与 Claude Code 引领变革

除了模型性能,Anthropic 在 AI 交互和工作流方面的创新也至关重要。

Artifacts 开启AI交互革命

Claude 推出的新功能Artifact,允许用户在AI对话界面中直接运行和调试代码。其核心特点包括:

实时代码执行:即时运行代码并查看结果。

交互式操作:实时调整和优化代码。

可视化预览:直观展示输出效果。

跨平台分享:便于团队协作与成果展示。

这些特性让开发者能快速验证想法、迭代原型并展示成果。Artifact 被誉为“改变游戏规则的产品”,为开发者带来更高效的编程体验,开启 AI 辅助开发的新模式,或将重塑应用程序开发流程。



Artifact 看似小更新,可能是未来几年AI最关键的战场之一:交互界面。AI 的挑战不仅是提升智能,而是让其易用、直观并融入工作流。相比之下,OpenAI 聚焦模型能力竞赛,Google 强调知识处理,而 Anthropic 更注重实用性和用户体验。通过 Artifact,Anthropic 将 AI 从聊天机器人转变为真正的合作伙伴,弥合工具与团队成员间的差距。



这反映了 AI 开发中的不同策略。OpenAI 和 Google 追求最大、最智能的模型,而 Anthropic 另辟蹊径,专注用户体验与工作流集成。在模型能力差距缩小的背景下,Anthropic 通过直观界面和生态系统建设留住用户。尤其在编程领域,Artifact 提供高效工作流程,尽管尚处起步阶段,但其创新潜力巨大。随着竞争对手意识到界面优化的重要性,这一领域将迎来更多突破。

●Claude Code极速提效神器:

Anthropic推出的Claude Code是一款命令行AI Coding产品,面向专业开发者,但其定位并非与AI IDE或Coding Agent直接竞争终端用户,而是作为AI Coding领域的重要基础设施。Claude Code通过强大的工具使用能力和agentic能力,帮助AI深入理解和修改大型代码库,推动AI-native开发工作流的形成。

用户可通过自然语言输入需求,Claude Code结合3.7 Sonnet的action scaling技术,展现出Devin级别的能力,能主动探索代码库,识别并使用关键模块,实现自我更正。这种能力让AI Coding从仅生成软件prototype的工具,进化为可参与CI/CD的深度开发工具,帮助AI更好地融入人类传统代码库。



Anthropic一贯聚焦于基础架构而非终端应用,Claude Code延续了这一风格。作为AI-native的核心组件,它主要面向AI agent而非仅人类用户,为AI Coding产品提供关键支持。命令行界面看似门槛高,却因其高度可验证的输出环境,成为AI agent协同开发的理想平台。

进一步看,“MCP + Claude Code + Computer use agent”组合有望成为新一代Coding Agent OS,支持reasoning model进行任务规划、执行、验证和迭代。相比GUI,命令行更适合AI-native交互,为AI在软件开发中深度参与提供了基础。Claude Code不仅是Anthropic的创新尝试,更是推动AI Coding基建和AI-native工作流实现的关键一步。

  • Action Scaling:AI Agent 的新里程碑

Claude 3.7 推出的action scaling能力,使 AI Agent 能够连续执行function calltool use,并根据环境反馈持续迭代,直到解决一个开放式问题。这一能力通过强化学习(RL)驱动,结合了tool uselong horizon reasoning(长程推理),为 AI Agent 在多步骤任务中的表现提供了强大支持。

Tool Use 的可靠性:在多步骤任务中,每一步的准确性至关重要。错误会以乘法形式累积,例如一个 10 步任务,每步准确率为 90%,整体成功率仅剩 35%。因此,tool use 的高可靠性是 action scaling 的基础。

Long Horizon Reasoning的作用:当任务中出现偏差或错误时,长程推理能力能帮助 Agent 重新调整方向,将推理过程拉回正确轨道,确保任务的最终完成。

Verifiable Environment:RL 在可验证环境中表现最佳,这些环境为 Agent 的能力提升提供了明确的反馈信号。AI Agent 的高潜力应用领域集中在 OS Browser、Coding、游戏、科研和搜索等具备明确信号的领域。

Online Learning / Iterative RL:个性化智能 Agent 需要具备在线学习或迭代 RL 能力,以在新的环境中动态调整自身策略。然而,当前技术存在瓶颈,包括缺乏高效的 RL fine-tuning 算法和模型在新环境中自主试错能力不足。克服这些瓶颈将使 Agent 实现真正的持续学习,适应多样化的现实场景。

Action scaling 通过 RL 增强了 AI Agent 在多步骤任务中的表现,使其在可验证环境中能够有效解决开放性问题。这一能力为 AI Agent 的落地应用铺平了道路,尤其是在编程、科研等领域展现出巨大潜力。

市场与开发者认可:从工具选择到社区热议

技术领先最终需要市场验证。Anthropic赢得开发者青睐的迹象日益明显。

工具生态的选择:Cursor的模型切换是最显著的例子。此外,Sourcegraph 数据显示其用户偏好 Anthropic 模型,Augment 等初创公司也公开表达对 Claude 的认可。GitLab、Midjourney、Perplexity 等知名公司同样对其编码能力表示赞赏。值得注意的是,连 OpenAI 的深度合作伙伴微软,也在 GitHub Copilot 中增加了对 Claude 的支持,显示出市场对多模型支持的需求。

开发者社区的反响:开发者社区的热烈讨论和“用脚投票”是 Anthropic 崛起的重要推手。从 Y Combinator CEO 转发赞扬 Claude 效率提升10倍的文章获得超400万的浏览量:



到ottogrid.ai CEO 称其公司50%代码由 Claude 编写并计划提高比例到80%:



再到开发者因 Claude 服务中断而“放假”:



额度用完即“下班”的趣味表达:



甚至Anthropic工程师Erik Schluntz在右手摔断的情况下借助Claude高效编码的故事:



都反映了Claude在开发者群体中的受欢迎程度 和实际应用价值。这种趋势直接推动了 Anthropic 编程相关业务的指数级增长。

技术深耕的领先者:MCP 标准与 AI 黑箱追踪研究

Anthropic 不仅在模型性能和交互创新上取得了显著成就,还通过在标准化和 AI 解释性研究领域的深耕,巩固了其在 AI 技术领域的领导地位。以下通过 Model Context Protocol (MCP) 标准和 AI 黑箱追踪研究两个方面,展示 Anthropic 如何推动 AI 技术的进步。

●MCP 标准:AI 行业的 USB-C

2024 年 11 月 24 日,Anthropic 推出了 Model Context Protocol (MCP),一个开放标准,旨在为 AI 助手与数据源之间的连接提供通用协议。MCP 的目标是通过标准化的方式连接内容库、商业工具和开发环境等数据源,帮助前沿模型生成更准确、更相关的响应。Anthropic 将 MCP 比作 AI 行业的“USB-C”,取代了以往为每个数据源构建定制集成的繁琐过程。

开放与协作:MCP 是开源的,鼓励社区参与和贡献,旨在建立一个协作生态系统,促进 AI 应用的开发和集成。开发人员可以通过 MCP 文档 构建服务器和客户端,连接各种数据源。

行业采纳:自推出以来,MCP 迅速获得业界认可。2025 年 3 月,OpenAI 宣布支持 MCP,随后在 2025 年 4 月,Google 也加入支持行列。据 Latent.Space 报道,MCP 正成为 AI 代理时代的默认标准,预计在 2025 年 7 月超过 OpenAPI 的采用率。

生态系统潜力:MCP 通过将复杂的 M×N 集成问题简化为 M+N 的生态系统解决方案,显著降低了开发复杂性。包括 Block、Apollo 和 Replit 在内的公司已在其平台上支持 MCP。



MCP 的推出标志着 AI 行业在标准化方面的重大进步。通过提供统一的连接协议,MCP 使开发人员能够更高效地构建 AI 驱动的应用程序,促进了 AI 技术的广泛应用。这一创新不仅提高了开发效率,还为 AI 系统的可扩展性奠定了基础。

●AI 黑箱追踪研究:揭开模型思维的神秘面纱

Anthropic在AI解释性研究领域的突破进一步证明了其技术领导力。2025 年 3 月,Anthropic 发表了两篇论文(Methods、Biology),详细介绍了如何通过追踪 Claude 模型的内部机制,揭示其处理信息和做出决策的过程。这些研究为提高 AI 透明度和安全性提供了重要工具。

以下是 Anthropic 研究中的关键发现,展示了 Claude 模型的复杂认知能力:



这些研究成果不仅提高了 AI 模型的透明度,还为确保 AI 系统与人类价值观对齐提供了科学基础。通过深入理解模型的内部机制,Anthropic 能够更好地控制和优化 AI 行为,减少潜在风险。此外,这一研究为审计模型安全性提供了新工具,帮助识别传统外部测试难以发现的问题。

OpenAI的应对策略:捍卫领先地位与调整布局

面对 Anthropic 的强力挑战,OpenAI 并未坐视不理,正积极采取措施巩固其市场地位。

收购Cursor竞争对手:据彭博新闻社报道,OpenAI 正在讨论以约30 亿美元的价格收购人工智能辅助编码工具公司Windsurf。这笔交易若达成,将成为 OpenAI 迄今为止最大的一笔收购,旨在通过整合 Windsurf 的技术,进一步巩固其在 AI 编程领域的布局。尽管交易条款尚未最终确定,谈判仍可能发生变化甚至破裂,但这一举动已显示出 OpenAI 应对竞争压力的决心。

继续深耕大模型:与此同时,OpenAI 近期发布了全新 AI 模型 o3 和 o4-mini,以及开源工具 Codex CLI,以增强其市场竞争力。o3 模型 首次能够主动使用和组合 ChatGPT 中的所有工具,包括网页搜索、Python 分析、深度推理视觉输入和图像生成,展现出更强的推理能力和自主执行任务的潜力。它不仅能处理复杂的编程任务,还能将视觉信息整合进推理过程,被 OpenAI 称为“首批实现图像思维的模型”。而 o4-mini 则是一个更小、更优化的版本,专为快速、成本效益高的推理设计,在数学、编码和视觉任务中表现出色,相较于此前的 o3-mini 在性能和效率上均有显著提升。此外,OpenAI 还推出了 Codex CLI,一个在终端运行的开源 AI agent,能够直接访问用户本地代码并结合多模态输入(如截图)进行推理,帮助开发者更高效地完成编程任务。这些新产品的发布,充分体现了 OpenAI 在 AI 编程领域的持续创新和对市场主导地位的捍卫。





两强路线差异:理念、技术与市场策略的对比

Anthropic与OpenAI的竞争,根植于其不同的起源、理念和战略选择。

●起源与理念:Anthropic由一批重视 AI 安全的前 OpenAI 核心成员创立,将“安全优先”作为核心原则,开发了“宪法 AI”和“负责任扩展政策”,并注册为公益公司(PBC)。OpenAI 则更侧重快速迭代和技术突破,通过 RLHF 加速模型对齐,商业化步伐更快。

●技术路线:Anthropic倾向于在特定领域(如长文本、编码、安全可控性)做深,其超大上下文窗口和 Artifacts 是体现。OpenAI 则追求通用性和广度,在多模态(Sora, DALL-E)和通用模型(GPT-4o)上布局广泛。

●市场策略: Anthropic初期更聚焦对安全性和可靠性要求高的企业市场和开发者,而 OpenAI 同时覆盖 C 端和 B 端。近期 Anthropic 似乎也在向更广泛的用户群体拓展。

●资本与生态:Anthropic获得亚马逊、谷歌等支持,采取多云策略。OpenAI 则与微软深度绑定。这种格局也反映了云服务巨头之间的代理竞争。

未来展望:AI编程的演进方向与竞争终局

Anthropic 的崛起预示着 AI 基础模型市场正从单一主导走向多元竞争,未来 AI 编程领域可能呈现以下趋势:

●编程能力“军备竞赛”:双方将持续在代码生成、理解、调试和自动化方面展开激烈竞争。AI 在编程任务中扮演的角色将越来越重要,甚至可能如 Dario Amodei 预测的那样,在不久的将来承担绝大部分编码工作。

●企业市场成关键战场:企业对 AI 的“安全、可靠、可控”需求将是竞争焦点。谁能更好地满足这些需求,谁就可能在利润丰厚的企业市场占据优势。

●多模型共存常态化:企业和开发者倾向于采用多个模型以利用各自优势、分散风险,形成 Anthropic、OpenAI 及其他参与者共存的市场格局。

●AI Agent的兴起:Claude Code 和 OpenAI 的类似工具预示着 AI 正从代码生成器向更自主的 AI Agent 演进,未来能够规划、执行和优化整个软件开发流程。这将深刻改变程序员的角色和软件开发模式。

结语:AI 编程“权力的游戏”

Anthropic 与 OpenAI 的竞争是当前 AI 领域最引人注目的发展之一。Anthropic 的成功证明了“安全优先”与“技术领先”可以并行,给 OpenAI 带来了前所未有的竞争压力。这场角逐不仅加速了 AI 技术的迭代,也促使我们思考 AI 与人类开发者协作的未来形态。是 Anthropic 继续保持上升势头,还是 OpenAI 成功调整并巩固地位?这场 AI 编程领域的“权力的游戏”结局未定,但其过程无疑将塑造行业的未来

参考文献:

https://sacra.com/research/anthropic-vs-openai

https://www.anthropic.com/news/visible-extended-thinking

https://menlovc.com/2024-the-state-of-generative-ai-in-the-enterprise

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/

TikTok美国业务再获90天缓冲:美方延迟处置期限背后的多重考量

返回网易首页 下载网易新闻客户端
相关推荐
热点推荐
美国地下首富:坚决不上市,年营收已经超越了当今的“世界首富”

美国地下首富:坚决不上市,年营收已经超越了当今的“世界首富”

娱乐看阿敞
2025-06-11 10:22:46
湖南烈犬咬人后续!狗已被打死,主人等待处置,受害者大面积植皮

湖南烈犬咬人后续!狗已被打死,主人等待处置,受害者大面积植皮

鋭娱之乐
2025-06-19 11:45:54
俞敏洪:当孩子不尊重你,不必翻脸,只需“乌鸦定律”就够了

俞敏洪:当孩子不尊重你,不必翻脸,只需“乌鸦定律”就够了

诗词中国
2025-06-17 13:12:55
伊朗驻联合国大使:如果我们得出结论美国直接参与了对伊朗的袭击,我们将对美国采取回应措施

伊朗驻联合国大使:如果我们得出结论美国直接参与了对伊朗的袭击,我们将对美国采取回应措施

和讯网
2025-06-18 16:27:03
国家出手,一半孩子上不了高中将成历史,家长:不用担心分流了?

国家出手,一半孩子上不了高中将成历史,家长:不用担心分流了?

新东方
2025-06-18 17:41:48
可以确定了,世界上第一个被摧毁的萨德反导系统!

可以确定了,世界上第一个被摧毁的萨德反导系统!

小企鹅侃世界
2025-06-17 17:51:03
出去吃饭需要报备?人民网再发声,管住小部分人的嘴,方得人心

出去吃饭需要报备?人民网再发声,管住小部分人的嘴,方得人心

二月侃事
2025-06-19 12:00:51
609死2626伤,伊以死伤惨重,土耳其:内塔尼亚胡不倒,中东不稳

609死2626伤,伊以死伤惨重,土耳其:内塔尼亚胡不倒,中东不稳

野山历史
2025-06-18 14:27:27
伊朗警告美国:所有选项都在考虑范围内

伊朗警告美国:所有选项都在考虑范围内

财联社
2025-06-19 16:04:08
2013年,外卖小哥贪便宜买下北京凶宅烂尾楼,10年后整条街是他的

2013年,外卖小哥贪便宜买下北京凶宅烂尾楼,10年后整条街是他的

罪案洞察者
2025-06-16 20:35:39
人均养老金有多少?人社部终于公布数据,看看你达标了吗?

人均养老金有多少?人社部终于公布数据,看看你达标了吗?

数字财经智库
2025-06-19 21:50:21
高兴,被查

高兴,被查

政知新媒体
2025-06-19 16:40:20
美国发出全球通缉令,逮捕中国芯片科学家陈正坤,现在怎么样了?

美国发出全球通缉令,逮捕中国芯片科学家陈正坤,现在怎么样了?

华人星光
2025-02-12 12:50:27
高芙谈萨巴伦卡道歉:已经过去了,很高兴她联系了我

高芙谈萨巴伦卡道歉:已经过去了,很高兴她联系了我

懂球帝
2025-06-19 19:43:15
39岁的佩通坦被73岁的政坛“老油条”洪森,好好的上了一课

39岁的佩通坦被73岁的政坛“老油条”洪森,好好的上了一课

乐天闲聊
2025-06-19 23:25:40
哈梅内伊,该谢幕了

哈梅内伊,该谢幕了

战争的艺术
2025-06-18 17:17:07
地堡克星终于来啦!“炸弹之王”GBU57 已经抵达约旦美军基地!

地堡克星终于来啦!“炸弹之王”GBU57 已经抵达约旦美军基地!

翻开历史和现实
2025-06-19 09:28:03
异性频繁出现这4种举动,其实早已是“情人”关系,你还蒙在鼓里

异性频繁出现这4种举动,其实早已是“情人”关系,你还蒙在鼓里

青苹果sht
2025-06-18 05:35:18
拿到稀土的特朗普,对华关税不再下调,中方对美国只有一个要求

拿到稀土的特朗普,对华关税不再下调,中方对美国只有一个要求

天行舰
2025-06-20 00:05:15
新血压标准已调整,不再是120/80mmHg!血压高者应自查,维护健康

新血压标准已调整,不再是120/80mmHg!血压高者应自查,维护健康

手机壳测试
2025-03-12 20:48:08
2025-06-20 02:16:49
荷马国际 incentive-icons
荷马国际
安全专业的海外理财平台
2617文章数 330989关注度
往期回顾 全部

科技要闻

罗永浩数字人爆火,可怕的不是5500万GMV

头条要闻

美打击伊核设施计划披露 特朗普鼓励以总理"继续干"

体育要闻

22年,云南足球走出了一条自己的路

娱乐要闻

章子怡“吃蛋糕”戏在全网爆火

财经要闻

Labubu黄牛价腰斩 谁会是最后的接盘侠

汽车要闻

5.99万起/空间大续航长 纯电小车凯翼拾月Mate上市

态度原创

数码
本地
家居
房产
公开课

数码要闻

小米史上手感最好的平板!REDMI K Pad图赏

本地新闻

黎锦匠人郑春荣:经纬千年 我在海岛织黎锦

家居要闻

山水之间 墨染风雨云间

房产要闻

预定爆款!江东CBD+海中,海口这一国企大盘,即将引爆市场!

公开课

李玫瑾:为什么性格比能力更重要?