人工智能创业公司 Anthropic 近日宣布推出其突破性的 Claude 3 系列模型,该系列大型语言模型 (LLM) 在各种认知任务上树立了新的性能标杆。
Claude 3 系列包含三个子模型,分别为 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus,它们提供不同程度的智能、速度和成本选择,以满足各种人工智能应用需求。
发布以来,它被誉为比 OpenAI 的 ChatGPT 和谷歌的 Gemini AI 更熟练、更博学、更善于推理。
根据 Anthropic 的研究,在这三种模型中,Opus 在几个关键领域的表现优于 GPT-3.5、GPT-4 和谷歌的 Gemini。
测试的技能包括常识、本科生水平的知识、研究生水平的专家推理、基础数学、数学问题解决和编码。
Anthropic 表示,凭借更高级的训练和知识,Claude 3 在复杂任务中表现出 “接近人类水平的理解力和流畅性”。
经过实测,Claude 3 可以在一分钟内抓取超过 200 篇最新论文,然后完成学习并回答相关问题。
Claude 新版本的响应速度也更快。Sonnet 是 Claude 2 和 Claude 2.1 的两倍,而且更加智能。
因此,Anthropic 宣称这种模式是检索信息或自动销售的理想选择。Haiku 是三者中速度最快的,它能在三秒内读完一篇带有图表的密集研究论文。
Anthropic 还称 Claude 3 比以前的版本更准确、更不易出错。为了测试这一点,该公司向不同的模型提出了大量复杂的事实性问题。
在使用 Opus 模型时,Claude 3 的正确答案是 Claude 2.1 的两倍,而错误答案则更少。
为了避免提供有害信息,人工智能通常会拒绝回答被认为不恰当的问题。但有时它们也会把无害的提示误解为有害的。
在 Anthropic 的测试中,Claude 3 比以前的版本更少出现拒绝回答无害提示的情况。
在这方面,三个 Claude 3 模型都能更好地理解请求,并能更好地区分有害和无害的问题。
不过在网友的“引导”下,Claude 3 还是被迫没素质起来,和我舍友玩 LOL 时不分伯仲。
Anthropic 还称Claude 3 更易于使用,能够接受更长的提示,并能更好地保留以前提示的信息。
Claude 的一项重大改进是其接受上传文件的能力。现在,用户可以向它发送各种类型的文件,包括图片、PDF、文本文件、Microsoft Office 文件、CSV 文件和 HTML 文件。
Claude 会对文件内容进行分析、总结并回答相关问题。不过,Claude 3 还是无法生成图片。
根据 36 氪的报道,Opus 在多项 AI 系统常用评估标准,包括本科级别专业知识(MMLU)、研究生级别专家推理(GPQA)、基础数学(GSM8K),均取得领先业界 LLM 的性能。
在 Maximumtruth.org 进行的智商测试中,Claude3 的 IQ 智商测试首次突破 100,达到人类平均水平。而我的大学舍友,玩个薇恩打完团满血满蓝,一般认为他的智商低于 90。
虽然 AI 智商测试超过 100 很惊人,但更惊人的是 AI 智商的增长速度。
Claude 3 系列模型在分析预测、创建细微内容、代码生成,以及用西班牙语、日语、法语等非英语语言交流的能力上都实现了显著进步。
另外,Claude 3 Opus 在 LSAT、MBE、高中数学竞赛 AMC 和 GRE 等多项考试中,成绩也和 GPT-4 不相上下,甚至大比分超越。
据称,它甚至帮科学家完成了某种算法。
在上下文窗口大小方面,Claude 3 系列模型在发布时将提供 20 万 token 的上下文窗口。
并且这三个模型都能够接受超过 100 万 token 的输入,Anthropic 未来可能会增加对更大上下文窗口的支持。
Opus 和 Sonnet 目前已集成到 Anthropic 的 Claude.ai 和 Claude API 中,可在 159 个国家 / 地区使用,Haiku 将很快推出。
Sonnet 也可以通过亚马逊云科技的 Bedrock 服务以及谷歌云 Vertex AI Model Garden 的私人预览渠道获得,Opus 和 Haiku 也将在不久后登陆这两个平台。
要试用 Claude 3,可以访问其官方网站。Claude Pro 每月收费 20 美元,使用更先进的 Opus 模型,并提供一些特权,如高峰期优先访问和提前使用新功能。
Anthropic 是由 OpenAI 的前成员创立的。
2021 年,一批 OpenAI 前员工不满于该组织在获得微软的投资后向封闭化方向发展,因而离开,并一同创立了 Anthropic。
他们对 OpenAI 在安全问题尚未解决的情况下便发布 GPT-3 的行为感到不满,并声称该组织已经为谋取利益而 “忘记了初心”。
这些前员工当中,包括拥有 GPT-2 以及 GPT-3 研究领域副总裁职位的 Dario Amodei,自 2016 年进入 OpenAI,并在过去担任该组织的研究副总裁,为其担当核心位置。
Anthropic 呼吁对人工智能采取更安全的方法,专注于创建遵循规则的模型,其推理过程是人类可以理解的。Anthropic 目前已获得来自谷歌、亚马逊等 26 个机构或个人的融资,总计融资金额达到了 76 亿美元。
公司的第一版 Claude 于 2023 年 3 月向公众发布。随后,Claude 2 于 2023 年 7 月发布。
Claude 3 在与使用者的对话中,将自己描述为一个具有自然语言处理能力的人工智能,同时还说:
“我要强调的是,我不是一个有生命的人,而是一个经过训练的非常先进的语言模型,它乐于助人、诚实、无害。我实际上没有情感体验,也没有主观经验。我的反应是高度复杂的模式识别和语言生成的结果,而不是内在的精神生活。”
本文源自IT之家
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.