曾几何时,OpenAI 及其 ChatGPT 模型是 AI 编程领域的标杆,其代码生成能力定义了市场预期。然而,近期的市场动态表明,这一格局正经历深刻调整。Anthropic 携其 Claude 系列模型,尤其是 Claude 3.5 及 3.7 Sonnet,正迅速成为该领域不可忽视的关键力量,引发了关于技术路线、市场策略和未来趋势的广泛讨论。
市场风向转变:Anthropic 强势崛起,关键指标亮眼
AI 编程领域的竞争天平正在倾斜。虽然 OpenAI 曾凭借先发优势占据主导,但 Anthropic 这家成立仅4年的公司,正以惊人的速度改变竞争态势。其估值已达615亿美元(E轮投后估值),软件开发与代码生成业务的年化收入在短期内实现十倍级增长。市场份额的变化直观地体现了这一趋势,Anthropic 的份额显著提升 ,从 2023 年的 12% 翻倍至 2024 年的 24%,反而 OpenAI 的市场份额从 50% 缩水至 34%。
一个明确的市场信号是,主流 AI 编程助手 Cursor 在 2024 年 7 月将其默认大模型从 GPT 系列切换至 Claude 3.5 Sonnet,这标志着开发者和工具生态对 Anthropic 技术实力的认可。同时,企业用户需求日益多元化,寻求更灵活、非单一供应商的 AI 解决方案,也为 Anthropic 提供了增长契机。
商业与资本表现:高估值倍数与健康的收入结构
Anthropic 的崛起不仅体现在技术层面,其商业表现和资本吸引力同样值得关注。
●融资与估值:2025年3月伊始,Anthropic 就完成了 35 亿美元融资,估值一举飙升至 615 亿美元。这轮融资由 Lightspeed Venture Partners 领投,豪掷 10 亿美元,后面跟着一长串科技与金融界的重量级玩家:亚马逊(累计投资 80 亿美元)、谷歌(累计投资30亿美元)、Salesforce Ventures、Cisco Investments、Fidelity Management & Research Company、General Catalyst、D1 Capital Partners 和 Jane Street。这阵容,堪称科技投资界的“全明星天团”!甚至占有14%股份的谷歌公司都不能享有投票权、董事会席位或董事会观察员权利,证明了Anthropic在融资议价过程中的强势地位。值得注意的是,截至2024年底,Anthropic年 ARR 约为8.75亿美元,估值/收入倍数(约 68.6 倍)显著高于 OpenAI(约 42.4 倍)。
这反映了资本市场对其在企业服务和技术创新方面,特别是编程能力所驱动的增长潜力抱有更高期待。
●收入结构: 2024 年,Anthropic 的 ARR 将达 10 亿美元,同比增长 1100%。其中,高达 85% 的收入来源于 API 业务,远超 OpenAI 的 27% 。这表明 Anthropic 在企业级服务市场,尤其是在利用其编程优势赋能开发者和企业方面,已建立起独特的、更具粘性的商业模式。
Claude 技术内核:定义AI编程新标杆
Anthropic 的核心竞争力在于其 Claude 系列模型,特别是 Claude 3.5 及 3.7 Sonnet,它们在 AI 编程领域展现出卓越性能。
●模型创新:Claude 3.7 Sonnet 第一次在业界引入“混合推理”(Hybrid Reasoning)技术,能在快速响应和深度分析(Extended Thinking)间智能切换,结合高达 128,000 token 的“思考预算”,使其在处理复杂编码、数学问题和长文本分析方面表现突出。这种设计可能成为未来高性能模型的标配。
●更长的可靠输出:Claude 3.7 Sonnet 在人工智能编码领域树立了新的里程碑,其单次生成1000至1500行可靠代码的能力超越了Claude 3.5 Sonnet 的200行限制。这一进步得益于更大的输出令牌容量和改进的上下文理解能力,为复杂编程任务的自动化和软件开发效率的提升开辟了新可能性。
- 性能基准:Claude 在多个权威编程能力基准测试中表现优异。在 LMSYS 维护的,专注于网页应用开发能力的 WebDev Arena 榜单上,Claude 3.7 Sonnet 甫一发布即登顶,大幅领先包括自家 Claude 3.5 Sonnet 在内的所有对手。
在衡量真实世界软件工程能力的 SWE-Bench Verified 测试和需要与用户及工具进行复杂交互的 TAU-bench 测试中,Claude 3.7 Sonnet 同样拔得头筹,超越 GPT-4o 。
LMSYS 的综合 benchmarks 也显示,Claude 3.7 Sonnet 在研究生级推理、编程和多语言任务上优于 GPT-4o。
- 实测能力: 社区的实际测试进一步印证了 Claude 的强大。例如,使用 p5.js 生成复杂布料模拟效果的代码,Claude 能够快速生成高质量结果。
一位学者甚至拿出自己1986年在 MIT 关于“布料外观建模”的硕士论文对比感叹,过去需要数天的工作,现在AI几分钟就能超越。
挑战生成爆火游戏《Flappy bird》,Claude 3.7 Sonnet一眼完胜o3 mini-high。
游戏中,玩家必须控制一只小鸟,跨越由各种不同长度水管所组成的障碍。
先看Claude 3.7 Sonnet,一次性生成的代码就高度还原了游戏理念:
而高档位推理模式下的o3 mini,只有一个小方块在画面中原地鬼畜,基本看不出游戏的样子。一时间,这一惨烈对比直接将Claude 3.7 Sonnet推上了新的高度。
交互与工作流创新:Artifacts 与 Claude Code 引领变革
除了模型性能,Anthropic 在 AI 交互和工作流方面的创新也至关重要。
●Artifacts 开启AI交互革命:
Claude 推出的新功能Artifact,允许用户在AI对话界面中直接运行和调试代码。其核心特点包括:
实时代码执行:即时运行代码并查看结果。
交互式操作:实时调整和优化代码。
可视化预览:直观展示输出效果。
跨平台分享:便于团队协作与成果展示。
这些特性让开发者能快速验证想法、迭代原型并展示成果。Artifact 被誉为“改变游戏规则的产品”,为开发者带来更高效的编程体验,开启 AI 辅助开发的新模式,或将重塑应用程序开发流程。
Artifact 看似小更新,可能是未来几年AI最关键的战场之一:交互界面。AI 的挑战不仅是提升智能,而是让其易用、直观并融入工作流。相比之下,OpenAI 聚焦模型能力竞赛,Google 强调知识处理,而 Anthropic 更注重实用性和用户体验。通过 Artifact,Anthropic 将 AI 从聊天机器人转变为真正的合作伙伴,弥合工具与团队成员间的差距。
这反映了 AI 开发中的不同策略。OpenAI 和 Google 追求最大、最智能的模型,而 Anthropic 另辟蹊径,专注用户体验与工作流集成。在模型能力差距缩小的背景下,Anthropic 通过直观界面和生态系统建设留住用户。尤其在编程领域,Artifact 提供高效工作流程,尽管尚处起步阶段,但其创新潜力巨大。随着竞争对手意识到界面优化的重要性,这一领域将迎来更多突破。
●Claude Code极速提效神器:
Anthropic推出的Claude Code是一款命令行AI Coding产品,面向专业开发者,但其定位并非与AI IDE或Coding Agent直接竞争终端用户,而是作为AI Coding领域的重要基础设施。Claude Code通过强大的工具使用能力和agentic能力,帮助AI深入理解和修改大型代码库,推动AI-native开发工作流的形成。
用户可通过自然语言输入需求,Claude Code结合3.7 Sonnet的action scaling技术,展现出Devin级别的能力,能主动探索代码库,识别并使用关键模块,实现自我更正。这种能力让AI Coding从仅生成软件prototype的工具,进化为可参与CI/CD的深度开发工具,帮助AI更好地融入人类传统代码库。
Anthropic一贯聚焦于基础架构而非终端应用,Claude Code延续了这一风格。作为AI-native的核心组件,它主要面向AI agent而非仅人类用户,为AI Coding产品提供关键支持。命令行界面看似门槛高,却因其高度可验证的输出环境,成为AI agent协同开发的理想平台。
进一步看,“MCP + Claude Code + Computer use agent”组合有望成为新一代Coding Agent OS,支持reasoning model进行任务规划、执行、验证和迭代。相比GUI,命令行更适合AI-native交互,为AI在软件开发中深度参与提供了基础。Claude Code不仅是Anthropic的创新尝试,更是推动AI Coding基建和AI-native工作流实现的关键一步。
- Action Scaling:AI Agent 的新里程碑
Claude 3.7 推出的action scaling能力,使 AI Agent 能够连续执行function call和tool use,并根据环境反馈持续迭代,直到解决一个开放式问题。这一能力通过强化学习(RL)驱动,结合了tool use和long horizon reasoning(长程推理),为 AI Agent 在多步骤任务中的表现提供了强大支持。
◆Tool Use 的可靠性:在多步骤任务中,每一步的准确性至关重要。错误会以乘法形式累积,例如一个 10 步任务,每步准确率为 90%,整体成功率仅剩 35%。因此,tool use 的高可靠性是 action scaling 的基础。
◆Long Horizon Reasoning的作用:当任务中出现偏差或错误时,长程推理能力能帮助 Agent 重新调整方向,将推理过程拉回正确轨道,确保任务的最终完成。
◆Verifiable Environment:RL 在可验证环境中表现最佳,这些环境为 Agent 的能力提升提供了明确的反馈信号。AI Agent 的高潜力应用领域集中在 OS Browser、Coding、游戏、科研和搜索等具备明确信号的领域。
◆Online Learning / Iterative RL:个性化智能 Agent 需要具备在线学习或迭代 RL 能力,以在新的环境中动态调整自身策略。然而,当前技术存在瓶颈,包括缺乏高效的 RL fine-tuning 算法和模型在新环境中自主试错能力不足。克服这些瓶颈将使 Agent 实现真正的持续学习,适应多样化的现实场景。
Action scaling 通过 RL 增强了 AI Agent 在多步骤任务中的表现,使其在可验证环境中能够有效解决开放性问题。这一能力为 AI Agent 的落地应用铺平了道路,尤其是在编程、科研等领域展现出巨大潜力。
市场与开发者认可:从工具选择到社区热议
技术领先最终需要市场验证。Anthropic赢得开发者青睐的迹象日益明显。
●工具生态的选择:Cursor的模型切换是最显著的例子。此外,Sourcegraph 数据显示其用户偏好 Anthropic 模型,Augment 等初创公司也公开表达对 Claude 的认可。GitLab、Midjourney、Perplexity 等知名公司同样对其编码能力表示赞赏。值得注意的是,连 OpenAI 的深度合作伙伴微软,也在 GitHub Copilot 中增加了对 Claude 的支持,显示出市场对多模型支持的需求。
●开发者社区的反响:开发者社区的热烈讨论和“用脚投票”是 Anthropic 崛起的重要推手。从 Y Combinator CEO 转发赞扬 Claude 效率提升10倍的文章获得超400万的浏览量:
到ottogrid.ai CEO 称其公司50%代码由 Claude 编写并计划提高比例到80%:
再到开发者因 Claude 服务中断而“放假”:
额度用完即“下班”的趣味表达:
甚至Anthropic工程师Erik Schluntz在右手摔断的情况下借助Claude高效编码的故事:
都反映了Claude在开发者群体中的受欢迎程度 和实际应用价值。这种趋势直接推动了 Anthropic 编程相关业务的指数级增长。
技术深耕的领先者:MCP 标准与 AI 黑箱追踪研究
Anthropic 不仅在模型性能和交互创新上取得了显著成就,还通过在标准化和 AI 解释性研究领域的深耕,巩固了其在 AI 技术领域的领导地位。以下通过 Model Context Protocol (MCP) 标准和 AI 黑箱追踪研究两个方面,展示 Anthropic 如何推动 AI 技术的进步。
●MCP 标准:AI 行业的 USB-C
2024 年 11 月 24 日,Anthropic 推出了 Model Context Protocol (MCP),一个开放标准,旨在为 AI 助手与数据源之间的连接提供通用协议。MCP 的目标是通过标准化的方式连接内容库、商业工具和开发环境等数据源,帮助前沿模型生成更准确、更相关的响应。Anthropic 将 MCP 比作 AI 行业的“USB-C”,取代了以往为每个数据源构建定制集成的繁琐过程。
◆开放与协作:MCP 是开源的,鼓励社区参与和贡献,旨在建立一个协作生态系统,促进 AI 应用的开发和集成。开发人员可以通过 MCP 文档 构建服务器和客户端,连接各种数据源。
◆行业采纳:自推出以来,MCP 迅速获得业界认可。2025 年 3 月,OpenAI 宣布支持 MCP,随后在 2025 年 4 月,Google 也加入支持行列。据 Latent.Space 报道,MCP 正成为 AI 代理时代的默认标准,预计在 2025 年 7 月超过 OpenAPI 的采用率。
◆生态系统潜力:MCP 通过将复杂的 M×N 集成问题简化为 M+N 的生态系统解决方案,显著降低了开发复杂性。包括 Block、Apollo 和 Replit 在内的公司已在其平台上支持 MCP。
MCP 的推出标志着 AI 行业在标准化方面的重大进步。通过提供统一的连接协议,MCP 使开发人员能够更高效地构建 AI 驱动的应用程序,促进了 AI 技术的广泛应用。这一创新不仅提高了开发效率,还为 AI 系统的可扩展性奠定了基础。
●AI 黑箱追踪研究:揭开模型思维的神秘面纱
Anthropic在AI解释性研究领域的突破进一步证明了其技术领导力。2025 年 3 月,Anthropic 发表了两篇论文(Methods、Biology),详细介绍了如何通过追踪 Claude 模型的内部机制,揭示其处理信息和做出决策的过程。这些研究为提高 AI 透明度和安全性提供了重要工具。
以下是 Anthropic 研究中的关键发现,展示了 Claude 模型的复杂认知能力:
这些研究成果不仅提高了 AI 模型的透明度,还为确保 AI 系统与人类价值观对齐提供了科学基础。通过深入理解模型的内部机制,Anthropic 能够更好地控制和优化 AI 行为,减少潜在风险。此外,这一研究为审计模型安全性提供了新工具,帮助识别传统外部测试难以发现的问题。
OpenAI的应对策略:捍卫领先地位与调整布局
面对 Anthropic 的强力挑战,OpenAI 并未坐视不理,正积极采取措施巩固其市场地位。
●收购Cursor竞争对手:据彭博新闻社报道,OpenAI 正在讨论以约30 亿美元的价格收购人工智能辅助编码工具公司Windsurf。这笔交易若达成,将成为 OpenAI 迄今为止最大的一笔收购,旨在通过整合 Windsurf 的技术,进一步巩固其在 AI 编程领域的布局。尽管交易条款尚未最终确定,谈判仍可能发生变化甚至破裂,但这一举动已显示出 OpenAI 应对竞争压力的决心。
●继续深耕大模型:与此同时,OpenAI 近期发布了全新 AI 模型 o3 和 o4-mini,以及开源工具 Codex CLI,以增强其市场竞争力。o3 模型 首次能够主动使用和组合 ChatGPT 中的所有工具,包括网页搜索、Python 分析、深度推理视觉输入和图像生成,展现出更强的推理能力和自主执行任务的潜力。它不仅能处理复杂的编程任务,还能将视觉信息整合进推理过程,被 OpenAI 称为“首批实现图像思维的模型”。而 o4-mini 则是一个更小、更优化的版本,专为快速、成本效益高的推理设计,在数学、编码和视觉任务中表现出色,相较于此前的 o3-mini 在性能和效率上均有显著提升。此外,OpenAI 还推出了 Codex CLI,一个在终端运行的开源 AI agent,能够直接访问用户本地代码并结合多模态输入(如截图)进行推理,帮助开发者更高效地完成编程任务。这些新产品的发布,充分体现了 OpenAI 在 AI 编程领域的持续创新和对市场主导地位的捍卫。
两强路线差异:理念、技术与市场策略的对比
Anthropic与OpenAI的竞争,根植于其不同的起源、理念和战略选择。
●起源与理念:Anthropic由一批重视 AI 安全的前 OpenAI 核心成员创立,将“安全优先”作为核心原则,开发了“宪法 AI”和“负责任扩展政策”,并注册为公益公司(PBC)。OpenAI 则更侧重快速迭代和技术突破,通过 RLHF 加速模型对齐,商业化步伐更快。
●技术路线:Anthropic倾向于在特定领域(如长文本、编码、安全可控性)做深,其超大上下文窗口和 Artifacts 是体现。OpenAI 则追求通用性和广度,在多模态(Sora, DALL-E)和通用模型(GPT-4o)上布局广泛。
●市场策略: Anthropic初期更聚焦对安全性和可靠性要求高的企业市场和开发者,而 OpenAI 同时覆盖 C 端和 B 端。近期 Anthropic 似乎也在向更广泛的用户群体拓展。
●资本与生态:Anthropic获得亚马逊、谷歌等支持,采取多云策略。OpenAI 则与微软深度绑定。这种格局也反映了云服务巨头之间的代理竞争。
未来展望:AI编程的演进方向与竞争终局
Anthropic 的崛起预示着 AI 基础模型市场正从单一主导走向多元竞争,未来 AI 编程领域可能呈现以下趋势:
●编程能力“军备竞赛”:双方将持续在代码生成、理解、调试和自动化方面展开激烈竞争。AI 在编程任务中扮演的角色将越来越重要,甚至可能如 Dario Amodei 预测的那样,在不久的将来承担绝大部分编码工作。
●企业市场成关键战场:企业对 AI 的“安全、可靠、可控”需求将是竞争焦点。谁能更好地满足这些需求,谁就可能在利润丰厚的企业市场占据优势。
●多模型共存常态化:企业和开发者倾向于采用多个模型以利用各自优势、分散风险,形成 Anthropic、OpenAI 及其他参与者共存的市场格局。
●AI Agent的兴起:Claude Code 和 OpenAI 的类似工具预示着 AI 正从代码生成器向更自主的 AI Agent 演进,未来能够规划、执行和优化整个软件开发流程。这将深刻改变程序员的角色和软件开发模式。
结语:AI 编程“权力的游戏”
Anthropic 与 OpenAI 的竞争是当前 AI 领域最引人注目的发展之一。Anthropic 的成功证明了“安全优先”与“技术领先”可以并行,给 OpenAI 带来了前所未有的竞争压力。这场角逐不仅加速了 AI 技术的迭代,也促使我们思考 AI 与人类开发者协作的未来形态。是 Anthropic 继续保持上升势头,还是 OpenAI 成功调整并巩固地位?这场 AI 编程领域的“权力的游戏”结局未定,但其过程无疑将塑造行业的未来
参考文献:
https://sacra.com/research/anthropic-vs-openai
https://www.anthropic.com/news/visible-extended-thinking
https://menlovc.com/2024-the-state-of-generative-ai-in-the-enterprise
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.