超强AI模型Claude 3智商超我大学舍友！但有点没素质……|算法|谷歌|人工智能|ai模型|claude

超强AI模型Claude 3智商超我大学舍友！但有点没素质……

2024-03-07 20:25:25　来源: 金融界

北京举报

分享至

人工智能创业公司 Anthropic 近日宣布推出其突破性的 Claude 3 系列模型，该系列大型语言模型 (LLM) 在各种认知任务上树立了新的性能标杆。

Claude 3 系列包含三个子模型，分别为 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus，它们提供不同程度的智能、速度和成本选择，以满足各种人工智能应用需求。

发布以来，它被誉为比 OpenAI 的 ChatGPT 和谷歌的 Gemini AI 更熟练、更博学、更善于推理。

根据 Anthropic 的研究，在这三种模型中，Opus 在几个关键领域的表现优于 GPT-3.5、GPT-4 和谷歌的 Gemini。

测试的技能包括常识、本科生水平的知识、研究生水平的专家推理、基础数学、数学问题解决和编码。

Anthropic 表示，凭借更高级的训练和知识，Claude 3 在复杂任务中表现出 “接近人类水平的理解力和流畅性”。

经过实测，Claude 3 可以在一分钟内抓取超过 200 篇最新论文，然后完成学习并回答相关问题。

Claude 新版本的响应速度也更快。Sonnet 是 Claude 2 和 Claude 2.1 的两倍，而且更加智能。

因此，Anthropic 宣称这种模式是检索信息或自动销售的理想选择。Haiku 是三者中速度最快的，它能在三秒内读完一篇带有图表的密集研究论文。

Anthropic 还称 Claude 3 比以前的版本更准确、更不易出错。为了测试这一点，该公司向不同的模型提出了大量复杂的事实性问题。

在使用 Opus 模型时，Claude 3 的正确答案是 Claude 2.1 的两倍，而错误答案则更少。

为了避免提供有害信息，人工智能通常会拒绝回答被认为不恰当的问题。但有时它们也会把无害的提示误解为有害的。

在 Anthropic 的测试中，Claude 3 比以前的版本更少出现拒绝回答无害提示的情况。

在这方面，三个 Claude 3 模型都能更好地理解请求，并能更好地区分有害和无害的问题。

不过在网友的“引导”下，Claude 3 还是被迫没素质起来，和我舍友玩 LOL 时不分伯仲。

Anthropic 还称Claude 3 更易于使用，能够接受更长的提示，并能更好地保留以前提示的信息。

Claude 的一项重大改进是其接受上传文件的能力。现在，用户可以向它发送各种类型的文件，包括图片、PDF、文本文件、Microsoft Office 文件、CSV 文件和 HTML 文件。

Claude 会对文件内容进行分析、总结并回答相关问题。不过，Claude 3 还是无法生成图片。

根据 36 氪的报道，Opus 在多项 AI 系统常用评估标准，包括本科级别专业知识（MMLU）、研究生级别专家推理（GPQA）、基础数学（GSM8K），均取得领先业界 LLM 的性能。

在 Maximumtruth.org 进行的智商测试中，Claude3 的 IQ 智商测试首次突破 100，达到人类平均水平。而我的大学舍友，玩个薇恩打完团满血满蓝，一般认为他的智商低于 90。

虽然 AI 智商测试超过 100 很惊人，但更惊人的是 AI 智商的增长速度。

Claude 3 系列模型在分析预测、创建细微内容、代码生成，以及用西班牙语、日语、法语等非英语语言交流的能力上都实现了显著进步。

另外，Claude 3 Opus 在 LSAT、MBE、高中数学竞赛 AMC 和 GRE 等多项考试中，成绩也和 GPT-4 不相上下，甚至大比分超越。

据称，它甚至帮科学家完成了某种算法。

在上下文窗口大小方面，Claude 3 系列模型在发布时将提供 20 万 token 的上下文窗口。

并且这三个模型都能够接受超过 100 万 token 的输入，Anthropic 未来可能会增加对更大上下文窗口的支持。

Opus 和 Sonnet 目前已集成到 Anthropic 的 Claude.ai 和 Claude API 中，可在 159 个国家 / 地区使用，Haiku 将很快推出。

Sonnet 也可以通过亚马逊云科技的 Bedrock 服务以及谷歌云 Vertex AI Model Garden 的私人预览渠道获得，Opus 和 Haiku 也将在不久后登陆这两个平台。

要试用 Claude 3，可以访问其官方网站。Claude Pro 每月收费 20 美元，使用更先进的 Opus 模型，并提供一些特权，如高峰期优先访问和提前使用新功能。

Anthropic 是由 OpenAI 的前成员创立的。

2021 年，一批 OpenAI 前员工不满于该组织在获得微软的投资后向封闭化方向发展，因而离开，并一同创立了 Anthropic。

他们对 OpenAI 在安全问题尚未解决的情况下便发布 GPT-3 的行为感到不满，并声称该组织已经为谋取利益而 “忘记了初心”。

这些前员工当中，包括拥有 GPT-2 以及 GPT-3 研究领域副总裁职位的 Dario Amodei，自 2016 年进入 OpenAI，并在过去担任该组织的研究副总裁，为其担当核心位置。

Anthropic 呼吁对人工智能采取更安全的方法，专注于创建遵循规则的模型，其推理过程是人类可以理解的。Anthropic 目前已获得来自谷歌、亚马逊等 26 个机构或个人的融资，总计融资金额达到了 76 亿美元。

公司的第一版 Claude 于 2023 年 3 月向公众发布。随后，Claude 2 于 2023 年 7 月发布。

Claude 3 在与使用者的对话中，将自己描述为一个具有自然语言处理能力的人工智能，同时还说：

“我要强调的是，我不是一个有生命的人，而是一个经过训练的非常先进的语言模型，它乐于助人、诚实、无害。我实际上没有情感体验，也没有主观经验。我的反应是高度复杂的模式识别和语言生成的结果，而不是内在的精神生活。”

本文源自IT之家

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

超强AI模型Claude 3智商超我大学舍友！但有点没素质……

"AGI不是大杀器，是普通人每天在用的产品"

菲副总统威胁"刺杀总统" 马科斯作出"淡化冲突"表态

菲副总统威胁"刺杀总统" 马科斯作出"淡化冲突"表态

穆雷与德约科维奇能凑成王炸组合吗？

叶珂被曝独自去产检，他俩真分了吗

专家建议将农民养老金提升至每月500元

问界M7今年累计交付量已突破18万辆

态度原创

海迪士尼下周电动轮椅入园或要证明

现代设计感 温馨两居室

花18万治疗阿尔茨海默病，值不值？

钢岚：新版本三大专武分析！2.0版本难道究极凯皇即将降世？

云游中国｜来伦布夏果感受充满Passion的人生

现代设计感温馨两居室