深度 | 市场份额翻倍！Anthropic如何用编程“黑科技”逆袭OpenAI|数据源|工作流|人工智能|openai

分享至

曾几何时，OpenAI 及其 ChatGPT 模型是 AI 编程领域的标杆，其代码生成能力定义了市场预期。然而，近期的市场动态表明，这一格局正经历深刻调整。Anthropic 携其 Claude 系列模型，尤其是 Claude 3.5 及 3.7 Sonnet，正迅速成为该领域不可忽视的关键力量，引发了关于技术路线、市场策略和未来趋势的广泛讨论。

市场风向转变：Anthropic 强势崛起，关键指标亮眼

AI 编程领域的竞争天平正在倾斜。虽然 OpenAI 曾凭借先发优势占据主导，但 Anthropic 这家成立仅4年的公司，正以惊人的速度改变竞争态势。其估值已达615亿美元(E轮投后估值)，软件开发与代码生成业务的年化收入在短期内实现十倍级增长。市场份额的变化直观地体现了这一趋势，Anthropic 的份额显著提升，从 2023 年的 12% 翻倍至 2024 年的 24%，反而 OpenAI 的市场份额从 50% 缩水至 34%。

一个明确的市场信号是，主流 AI 编程助手 Cursor 在 2024 年 7 月将其默认大模型从 GPT 系列切换至 Claude 3.5 Sonnet，这标志着开发者和工具生态对 Anthropic 技术实力的认可。同时，企业用户需求日益多元化，寻求更灵活、非单一供应商的 AI 解决方案，也为 Anthropic 提供了增长契机。

商业与资本表现：高估值倍数与健康的收入结构

Anthropic 的崛起不仅体现在技术层面，其商业表现和资本吸引力同样值得关注。

●融资与估值：2025年3月伊始，Anthropic 就完成了 35 亿美元融资，估值一举飙升至 615 亿美元。这轮融资由 Lightspeed Venture Partners 领投，豪掷 10 亿美元，后面跟着一长串科技与金融界的重量级玩家：亚马逊（累计投资 80 亿美元）、谷歌（累计投资30亿美元）、Salesforce Ventures、Cisco Investments、Fidelity Management & Research Company、General Catalyst、D1 Capital Partners 和 Jane Street。这阵容，堪称科技投资界的“全明星天团”！甚至占有14%股份的谷歌公司都不能享有投票权、董事会席位或董事会观察员权利，证明了Anthropic在融资议价过程中的强势地位。值得注意的是，截至2024年底，Anthropic年 ARR 约为8.75亿美元，估值/收入倍数（约 68.6 倍）显著高于 OpenAI（约 42.4 倍）。

这反映了资本市场对其在企业服务和技术创新方面，特别是编程能力所驱动的增长潜力抱有更高期待。

●收入结构： 2024 年，Anthropic 的 ARR 将达 10 亿美元，同比增长 1100%。其中，高达 85% 的收入来源于 API 业务，远超 OpenAI 的 27% 。这表明 Anthropic 在企业级服务市场，尤其是在利用其编程优势赋能开发者和企业方面，已建立起独特的、更具粘性的商业模式。

Claude 技术内核：定义AI编程新标杆

Anthropic 的核心竞争力在于其 Claude 系列模型，特别是 Claude 3.5 及 3.7 Sonnet，它们在 AI 编程领域展现出卓越性能。

●模型创新：Claude 3.7 Sonnet 第一次在业界引入“混合推理”（Hybrid Reasoning）技术，能在快速响应和深度分析（Extended Thinking）间智能切换，结合高达 128,000 token 的“思考预算”，使其在处理复杂编码、数学问题和长文本分析方面表现突出。这种设计可能成为未来高性能模型的标配。

●更长的可靠输出：Claude 3.7 Sonnet 在人工智能编码领域树立了新的里程碑，其单次生成1000至1500行可靠代码的能力超越了Claude 3.5 Sonnet 的200行限制。这一进步得益于更大的输出令牌容量和改进的上下文理解能力，为复杂编程任务的自动化和软件开发效率的提升开辟了新可能性。

性能基准：Claude 在多个权威编程能力基准测试中表现优异。在 LMSYS 维护的，专注于网页应用开发能力的 WebDev Arena 榜单上，Claude 3.7 Sonnet 甫一发布即登顶，大幅领先包括自家 Claude 3.5 Sonnet 在内的所有对手。

在衡量真实世界软件工程能力的 SWE-Bench Verified 测试和需要与用户及工具进行复杂交互的 TAU-bench 测试中，Claude 3.7 Sonnet 同样拔得头筹，超越 GPT-4o 。

LMSYS 的综合 benchmarks 也显示，Claude 3.7 Sonnet 在研究生级推理、编程和多语言任务上优于 GPT-4o。

实测能力：社区的实际测试进一步印证了 Claude 的强大。例如，使用 p5.js 生成复杂布料模拟效果的代码，Claude 能够快速生成高质量结果。

一位学者甚至拿出自己1986年在 MIT 关于“布料外观建模”的硕士论文对比感叹，过去需要数天的工作，现在AI几分钟就能超越。

挑战生成爆火游戏《Flappy bird》，Claude 3.7 Sonnet一眼完胜o3 mini-high。

游戏中，玩家必须控制一只小鸟，跨越由各种不同长度水管所组成的障碍。

先看Claude 3.7 Sonnet，一次性生成的代码就高度还原了游戏理念：

而高档位推理模式下的o3 mini，只有一个小方块在画面中原地鬼畜，基本看不出游戏的样子。一时间，这一惨烈对比直接将Claude 3.7 Sonnet推上了新的高度。

交互与工作流创新：Artifacts 与 Claude Code 引领变革

除了模型性能，Anthropic 在 AI 交互和工作流方面的创新也至关重要。

●Artifacts 开启AI交互革命：

Claude 推出的新功能Artifact，允许用户在AI对话界面中直接运行和调试代码。其核心特点包括：

实时代码执行：即时运行代码并查看结果。

交互式操作：实时调整和优化代码。

可视化预览：直观展示输出效果。

跨平台分享：便于团队协作与成果展示。

这些特性让开发者能快速验证想法、迭代原型并展示成果。Artifact 被誉为“改变游戏规则的产品”，为开发者带来更高效的编程体验，开启 AI 辅助开发的新模式，或将重塑应用程序开发流程。

Artifact 看似小更新，可能是未来几年AI最关键的战场之一：交互界面。AI 的挑战不仅是提升智能，而是让其易用、直观并融入工作流。相比之下，OpenAI 聚焦模型能力竞赛，Google 强调知识处理，而 Anthropic 更注重实用性和用户体验。通过 Artifact，Anthropic 将 AI 从聊天机器人转变为真正的合作伙伴，弥合工具与团队成员间的差距。

这反映了 AI 开发中的不同策略。OpenAI 和 Google 追求最大、最智能的模型，而 Anthropic 另辟蹊径，专注用户体验与工作流集成。在模型能力差距缩小的背景下，Anthropic 通过直观界面和生态系统建设留住用户。尤其在编程领域，Artifact 提供高效工作流程，尽管尚处起步阶段，但其创新潜力巨大。随着竞争对手意识到界面优化的重要性，这一领域将迎来更多突破。

●Claude Code极速提效神器：

Anthropic推出的Claude Code是一款命令行AI Coding产品，面向专业开发者，但其定位并非与AI IDE或Coding Agent直接竞争终端用户，而是作为AI Coding领域的重要基础设施。Claude Code通过强大的工具使用能力和agentic能力，帮助AI深入理解和修改大型代码库，推动AI-native开发工作流的形成。

用户可通过自然语言输入需求，Claude Code结合3.7 Sonnet的action scaling技术，展现出Devin级别的能力，能主动探索代码库，识别并使用关键模块，实现自我更正。这种能力让AI Coding从仅生成软件prototype的工具，进化为可参与CI/CD的深度开发工具，帮助AI更好地融入人类传统代码库。

Anthropic一贯聚焦于基础架构而非终端应用，Claude Code延续了这一风格。作为AI-native的核心组件，它主要面向AI agent而非仅人类用户，为AI Coding产品提供关键支持。命令行界面看似门槛高，却因其高度可验证的输出环境，成为AI agent协同开发的理想平台。

进一步看，“MCP + Claude Code + Computer use agent”组合有望成为新一代Coding Agent OS，支持reasoning model进行任务规划、执行、验证和迭代。相比GUI，命令行更适合AI-native交互，为AI在软件开发中深度参与提供了基础。Claude Code不仅是Anthropic的创新尝试，更是推动AI Coding基建和AI-native工作流实现的关键一步。

Action Scaling：AI Agent 的新里程碑

Claude 3.7 推出的action scaling能力，使 AI Agent 能够连续执行function call和tool use，并根据环境反馈持续迭代，直到解决一个开放式问题。这一能力通过强化学习（RL）驱动，结合了tool use和long horizon reasoning（长程推理），为 AI Agent 在多步骤任务中的表现提供了强大支持。

◆Tool Use 的可靠性：在多步骤任务中，每一步的准确性至关重要。错误会以乘法形式累积，例如一个 10 步任务，每步准确率为 90%，整体成功率仅剩 35%。因此，tool use 的高可靠性是 action scaling 的基础。

◆Long Horizon Reasoning的作用：当任务中出现偏差或错误时，长程推理能力能帮助 Agent 重新调整方向，将推理过程拉回正确轨道，确保任务的最终完成。

◆Verifiable Environment：RL 在可验证环境中表现最佳，这些环境为 Agent 的能力提升提供了明确的反馈信号。AI Agent 的高潜力应用领域集中在 OS Browser、Coding、游戏、科研和搜索等具备明确信号的领域。

◆Online Learning / Iterative RL：个性化智能 Agent 需要具备在线学习或迭代 RL 能力，以在新的环境中动态调整自身策略。然而，当前技术存在瓶颈，包括缺乏高效的 RL fine-tuning 算法和模型在新环境中自主试错能力不足。克服这些瓶颈将使 Agent 实现真正的持续学习，适应多样化的现实场景。

Action scaling 通过 RL 增强了 AI Agent 在多步骤任务中的表现，使其在可验证环境中能够有效解决开放性问题。这一能力为 AI Agent 的落地应用铺平了道路，尤其是在编程、科研等领域展现出巨大潜力。

市场与开发者认可：从工具选择到社区热议

技术领先最终需要市场验证。Anthropic赢得开发者青睐的迹象日益明显。

●工具生态的选择：Cursor的模型切换是最显著的例子。此外，Sourcegraph 数据显示其用户偏好 Anthropic 模型，Augment 等初创公司也公开表达对 Claude 的认可。GitLab、Midjourney、Perplexity 等知名公司同样对其编码能力表示赞赏。值得注意的是，连 OpenAI 的深度合作伙伴微软，也在 GitHub Copilot 中增加了对 Claude 的支持，显示出市场对多模型支持的需求。

●开发者社区的反响：开发者社区的热烈讨论和“用脚投票”是 Anthropic 崛起的重要推手。从 Y Combinator CEO 转发赞扬 Claude 效率提升10倍的文章获得超400万的浏览量：

到ottogrid.ai CEO 称其公司50%代码由 Claude 编写并计划提高比例到80%：

再到开发者因 Claude 服务中断而“放假”：

额度用完即“下班”的趣味表达：

甚至Anthropic工程师Erik Schluntz在右手摔断的情况下借助Claude高效编码的故事：

都反映了Claude在开发者群体中的受欢迎程度和实际应用价值。这种趋势直接推动了 Anthropic 编程相关业务的指数级增长。

技术深耕的领先者：MCP 标准与 AI 黑箱追踪研究

Anthropic 不仅在模型性能和交互创新上取得了显著成就，还通过在标准化和 AI 解释性研究领域的深耕，巩固了其在 AI 技术领域的领导地位。以下通过 Model Context Protocol (MCP) 标准和 AI 黑箱追踪研究两个方面，展示 Anthropic 如何推动 AI 技术的进步。

●MCP 标准：AI 行业的 USB-C

2024 年 11 月 24 日，Anthropic 推出了 Model Context Protocol (MCP)，一个开放标准，旨在为 AI 助手与数据源之间的连接提供通用协议。MCP 的目标是通过标准化的方式连接内容库、商业工具和开发环境等数据源，帮助前沿模型生成更准确、更相关的响应。Anthropic 将 MCP 比作 AI 行业的“USB-C”，取代了以往为每个数据源构建定制集成的繁琐过程。

◆开放与协作：MCP 是开源的，鼓励社区参与和贡献，旨在建立一个协作生态系统，促进 AI 应用的开发和集成。开发人员可以通过 MCP 文档构建服务器和客户端，连接各种数据源。

◆行业采纳：自推出以来，MCP 迅速获得业界认可。2025 年 3 月，OpenAI 宣布支持 MCP，随后在 2025 年 4 月，Google 也加入支持行列。据 Latent.Space 报道，MCP 正成为 AI 代理时代的默认标准，预计在 2025 年 7 月超过 OpenAPI 的采用率。

◆生态系统潜力：MCP 通过将复杂的 M×N 集成问题简化为 M+N 的生态系统解决方案，显著降低了开发复杂性。包括 Block、Apollo 和 Replit 在内的公司已在其平台上支持 MCP。

MCP 的推出标志着 AI 行业在标准化方面的重大进步。通过提供统一的连接协议，MCP 使开发人员能够更高效地构建 AI 驱动的应用程序，促进了 AI 技术的广泛应用。这一创新不仅提高了开发效率，还为 AI 系统的可扩展性奠定了基础。

●AI 黑箱追踪研究：揭开模型思维的神秘面纱

Anthropic在AI解释性研究领域的突破进一步证明了其技术领导力。2025 年 3 月，Anthropic 发表了两篇论文（Methods、Biology），详细介绍了如何通过追踪 Claude 模型的内部机制，揭示其处理信息和做出决策的过程。这些研究为提高 AI 透明度和安全性提供了重要工具。

以下是 Anthropic 研究中的关键发现，展示了 Claude 模型的复杂认知能力：

这些研究成果不仅提高了 AI 模型的透明度，还为确保 AI 系统与人类价值观对齐提供了科学基础。通过深入理解模型的内部机制，Anthropic 能够更好地控制和优化 AI 行为，减少潜在风险。此外，这一研究为审计模型安全性提供了新工具，帮助识别传统外部测试难以发现的问题。

OpenAI的应对策略：捍卫领先地位与调整布局

面对 Anthropic 的强力挑战，OpenAI 并未坐视不理，正积极采取措施巩固其市场地位。

●收购Cursor竞争对手：据彭博新闻社报道，OpenAI 正在讨论以约30 亿美元的价格收购人工智能辅助编码工具公司Windsurf。这笔交易若达成，将成为 OpenAI 迄今为止最大的一笔收购，旨在通过整合 Windsurf 的技术，进一步巩固其在 AI 编程领域的布局。尽管交易条款尚未最终确定，谈判仍可能发生变化甚至破裂，但这一举动已显示出 OpenAI 应对竞争压力的决心。

●继续深耕大模型：与此同时，OpenAI 近期发布了全新 AI 模型 o3 和 o4-mini，以及开源工具 Codex CLI，以增强其市场竞争力。o3 模型首次能够主动使用和组合 ChatGPT 中的所有工具，包括网页搜索、Python 分析、深度推理视觉输入和图像生成，展现出更强的推理能力和自主执行任务的潜力。它不仅能处理复杂的编程任务，还能将视觉信息整合进推理过程，被 OpenAI 称为“首批实现图像思维的模型”。而 o4-mini 则是一个更小、更优化的版本，专为快速、成本效益高的推理设计，在数学、编码和视觉任务中表现出色，相较于此前的 o3-mini 在性能和效率上均有显著提升。此外，OpenAI 还推出了 Codex CLI，一个在终端运行的开源 AI agent，能够直接访问用户本地代码并结合多模态输入（如截图）进行推理，帮助开发者更高效地完成编程任务。这些新产品的发布，充分体现了 OpenAI 在 AI 编程领域的持续创新和对市场主导地位的捍卫。

两强路线差异：理念、技术与市场策略的对比

Anthropic与OpenAI的竞争，根植于其不同的起源、理念和战略选择。

●起源与理念：Anthropic由一批重视 AI 安全的前 OpenAI 核心成员创立，将“安全优先”作为核心原则，开发了“宪法 AI”和“负责任扩展政策”，并注册为公益公司（PBC）。OpenAI 则更侧重快速迭代和技术突破，通过 RLHF 加速模型对齐，商业化步伐更快。

●技术路线：Anthropic倾向于在特定领域（如长文本、编码、安全可控性）做深，其超大上下文窗口和 Artifacts 是体现。OpenAI 则追求通用性和广度，在多模态（Sora, DALL-E）和通用模型（GPT-4o）上布局广泛。

●市场策略： Anthropic初期更聚焦对安全性和可靠性要求高的企业市场和开发者，而 OpenAI 同时覆盖 C 端和 B 端。近期 Anthropic 似乎也在向更广泛的用户群体拓展。

●资本与生态：Anthropic获得亚马逊、谷歌等支持，采取多云策略。OpenAI 则与微软深度绑定。这种格局也反映了云服务巨头之间的代理竞争。

未来展望：AI编程的演进方向与竞争终局

Anthropic 的崛起预示着 AI 基础模型市场正从单一主导走向多元竞争，未来 AI 编程领域可能呈现以下趋势：

●编程能力“军备竞赛”：双方将持续在代码生成、理解、调试和自动化方面展开激烈竞争。AI 在编程任务中扮演的角色将越来越重要，甚至可能如 Dario Amodei 预测的那样，在不久的将来承担绝大部分编码工作。

●企业市场成关键战场：企业对 AI 的“安全、可靠、可控”需求将是竞争焦点。谁能更好地满足这些需求，谁就可能在利润丰厚的企业市场占据优势。

●多模型共存常态化：企业和开发者倾向于采用多个模型以利用各自优势、分散风险，形成 Anthropic、OpenAI 及其他参与者共存的市场格局。

●AI Agent的兴起：Claude Code 和 OpenAI 的类似工具预示着 AI 正从代码生成器向更自主的 AI Agent 演进，未来能够规划、执行和优化整个软件开发流程。这将深刻改变程序员的角色和软件开发模式。

结语：AI 编程“权力的游戏”

Anthropic 与 OpenAI 的竞争是当前 AI 领域最引人注目的发展之一。Anthropic 的成功证明了“安全优先”与“技术领先”可以并行，给 OpenAI 带来了前所未有的竞争压力。这场角逐不仅加速了 AI 技术的迭代，也促使我们思考 AI 与人类开发者协作的未来形态。是 Anthropic 继续保持上升势头，还是 OpenAI 成功调整并巩固地位？这场 AI 编程领域的“权力的游戏”结局未定，但其过程无疑将塑造行业的未来

参考文献：

https://sacra.com/research/anthropic-vs-openai

https://www.anthropic.com/news/visible-extended-thinking

https://menlovc.com/2024-the-state-of-generative-ai-in-the-enterprise

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.