网易首页 > 网易号 > 正文 申请入驻

力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

0
分享至

机器之心报道

机器之心编辑部

如今,大模型领域更卷了!

前脚 OpenAI 发布 GPT4o,硬控全场,后脚就被最大的竞争对手 Anthropic 超越了。



刚刚,Anthropic 发布了全新大模型 Claude 3.5 Sonnet,号称是迄今为止最智能的模型



据介绍,Claude 3.5 Sonnet 是 Anthropic 即将推出的 Claude 3.5 系列的首个版本。该模型提高了整个领域的智能水平,在绝大多数基准评估中都超越了竞品大模型和自家前代最强 Claude 3 Opus。与此同时,运行速度、成本与自家前代 Claude 3 Sonnet 相当。



地址:https://claude.ai/

目前,Claude 3.5 Sonnet 已经在 Claude.ai 和 Claude iOS 应用程序上免费提供,而 Claude Pro 和 Team 计划订户能够以更高的速率访问它。

此外,Claude 3.5 Sonnet 已经可以直接通过 Anthropic API、亚马逊云科技 Bedrock 等渠道使用。每百万个输入 token 的价格为 3 美元,每百万个输出 token 的价格为 15 美元,上下文窗口为 200k token





Claude、GPT、Gemini三个模型迭代发布时间线。

Anthropic 称其目标是每隔几个月大幅度改进性能、速度和成本之间的权衡曲线。今年晚些时候将发布 Claude 3.5 Haiku 和 Claude 3.5 Opus。

除了开发下一代大模型之外,Anthropic 正在开发新的模式和功能,以支持更多企业用例,包括与企业应用程序的集成。团队还在探索诸如 Memory 之类的功能,使得模型能够记住用户的偏好和指定的交互历史,从而实现更加个性化和高效的体验。

比 GPT-4o 更智能

比 Claude 3 Opus 快两倍

Claude 3.5 Sonnet为研究生水平推理 (GPQA)、本科生水平知识 (MMLU) 和编码能力 (HumanEval) 设定了新的行业基准。它在理解细微差别、幽默和复杂指令方面表现出显著的进步,并且擅长以自然、亲切的语气撰写高质量的内容。

Claude 3.5 Sonnet 的运行速度是 Claude 3 Opus 的两倍。这种性能的提升加上实惠的价格,使 Claude 3.5 Sonnet 成为复杂任务的理想选择。

在内部代理编码评估中,Claude 3.5 Sonnet 解决了 64% 的问题,优于 Claude 3 Opus(解决了 38%)。Anthropic 评估测试了 Claude 3.5 Sonnet 根据自然语言描述的需求,修复错误或增加功能到开源代码库中的能力。

在获得指导和相关工具后,Claude 3.5 Sonnet 可以独立编写、编辑和执行代码,并具有复杂的推理和故障排除功能。Claude 3.5 Sonnet 可以轻松处理代码转换,这对于更新旧版应用程序和迁移代码库特别有效。

下表为 Claude 3.5 Sonnet 与其他模型的比较,评估基准包括推理、阅读理解、数学、科学和编码。在所有这些基准测试中,Claude 3.5 Sonnet 的表现均优于之前的前沿模型 Claude 3 Opus。

我们也可以看到表中 Claude3.5 与 GPT-4o 的对比数据,除了数学方面,得分都比 GPT-4o 高或者逼近



迄今为止最强视觉模型

Anthropic 表示,Claude 3.5 Sonnet 是其最强的视觉模型,在所有标准视觉基准测试中都超越了前代 Claude 3 Opus

尤其是在需要视觉推理的任务中表现更为明显,例如解释图表、图形或者从不完美的图像中转录文本,这是零售、物流和金融服务行业的核心功能。在这些领域,人工智能可以从图像、图形或插图中收集到比单独文本中更多的见解。

下图为 Claude 3.5 Sonnet 与 Claude 3 Opus、GPT-4o、Gemini 1.5 Pro 在视觉数学推理、科学图表、视觉问答、图表 QA、文件视觉 QA 任务中的性能比较。



Artifacts—— 使用 Claude 的新方式

Anthropic 还在 Claude.ai 上推出了 Artifacts,这是一项扩展用户与 Claude 交互方式的新功能。当用户要求 Claude 生成代码片段、文本文档或网站设计等内容时,这些工件会出现在他们的对话旁边的专用窗口中。这创建了一个动态工作空间,他们可以在其中实时查看、编辑和构建 Claude 的创作,将人工智能生成的内容无缝集成到他们的项目和工作流程中。

Artifacts 预览功能标志着 Claude 从对话式 AI 向协作工作环境的演变,并将很快扩展到支持团队协作。在不久的将来,团队将能够安全地将他们的知识、文档和正在进行的工作集中在一个共享空间中,而 Claude 则按需充当队友。

最后,Anthropic 表示他们对模型进行了严格的测试,并致力于减少其被滥用的可能性。

Anthropic 安全团队对 Claude 3.5 Sonnet 在化学、生物、放射性和核(CBRN)风险、网络安全和自主能力领域进行了一系列的评估,最后将 Claude 3.5 Sonnet 分类为 AI 安全等级 2(ASL-2)模型,表明它不会构成灾难性伤害的风险。

此外,作为对安全和透明度承诺的一部分,Anthropic 还与外部专家合作测试和完善这一最新模型中的安全机制。

官博地址:https://www.anthropic.com/news/claude-3-5-sonnet

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
9名将领被罢免全国人大代表职务,释放出什么信号

9名将领被罢免全国人大代表职务,释放出什么信号

李昕言温度空间
2024-01-10 08:14:09
官方证实苏州救日本母子市民已去世,日媒找到现场目击者:要不是她,五六十个小孩恐要遭殃

官方证实苏州救日本母子市民已去世,日媒找到现场目击者:要不是她,五六十个小孩恐要遭殃

可达鸭面面观
2024-06-28 08:34:19
小姨远嫁那天外婆大骂她白眼狼,还劝我别学她,殊不知我会更过分

小姨远嫁那天外婆大骂她白眼狼,还劝我别学她,殊不知我会更过分

南笙故事
2024-06-30 10:35:02
香港男星被房东吐槽没诚信,4孩1外佣3只狗,一家6口无家可归

香港男星被房东吐槽没诚信,4孩1外佣3只狗,一家6口无家可归

风云人物看历史
2024-06-29 21:53:39
原来广东才是祖宗严选的流放之地!看了“发霉”的广州忽然就懂了

原来广东才是祖宗严选的流放之地!看了“发霉”的广州忽然就懂了

娱乐洞察点点
2024-06-29 13:55:52
万万没想到嫦娥六号的月壤分享日本和印度都有份,咱们真的很慷慨

万万没想到嫦娥六号的月壤分享日本和印度都有份,咱们真的很慷慨

橘色数码
2024-06-29 13:24:24
原来新冠疫情已被写进历史书了!128个字讲述3年,家长们五味杂陈

原来新冠疫情已被写进历史书了!128个字讲述3年,家长们五味杂陈

户外阿毽
2024-06-14 22:50:19
这一次,广州荔枝比房子还难解决

这一次,广州荔枝比房子还难解决

楼主说楼市
2024-06-29 21:54:56
该国总统访华前,特地交代国内一件大事,中企的权利必须归还

该国总统访华前,特地交代国内一件大事,中企的权利必须归还

石江月
2024-06-30 10:20:02
皇家马德里转会传闻:法甲中场确定为克罗斯接班人

皇家马德里转会传闻:法甲中场确定为克罗斯接班人

油泼辣不辣
2024-06-30 07:36:40
曾仕强恩师刘培中,预言2033年人类将面临大劫难,并留下破解之法

曾仕强恩师刘培中,预言2033年人类将面临大劫难,并留下破解之法

郁郁乎文
2023-11-28 11:20:02
笑麻了,北京协和医学院毕业生博士比硕士还多,评论区秒变许愿池

笑麻了,北京协和医学院毕业生博士比硕士还多,评论区秒变许愿池

奇特短尾矮袋鼠
2024-06-29 23:35:42
蚊子的克星,原来不是蚊香!教你3个“土方法”,整晚开窗都不怕

蚊子的克星,原来不是蚊香!教你3个“土方法”,整晚开窗都不怕

美家指南
2024-06-25 16:07:31
太心酸了!就业形势有多严峻?网友:已经颠成我不敢想象的样子了

太心酸了!就业形势有多严峻?网友:已经颠成我不敢想象的样子了

时尚的弄潮
2024-06-28 00:45:46
女人的五个器官,不会随意给男人触碰亲吻,因为它们容易动情

女人的五个器官,不会随意给男人触碰亲吻,因为它们容易动情

娱乐洞察点点
2024-06-30 07:30:20
“姜萍事件”真相越来越近了?造假都能造到数学上?怎么可能?

“姜萍事件”真相越来越近了?造假都能造到数学上?怎么可能?

户外钓鱼哥阿勇
2024-06-30 00:48:48
只能活到18岁?患罕见病男孩董昊轩,高考645分!

只能活到18岁?患罕见病男孩董昊轩,高考645分!

环球网资讯
2024-06-29 19:50:18
实锤!宇辉西安招待刘畊宏一家,重庆文旅连发3部宇辉视频被群嘲

实锤!宇辉西安招待刘畊宏一家,重庆文旅连发3部宇辉视频被群嘲

暖心的小屋
2024-06-29 22:18:45
谨以此献给1980~1989出生的人,80后无限循环的一生,太真实了!

谨以此献给1980~1989出生的人,80后无限循环的一生,太真实了!

小九聊史
2023-06-15 10:15:51
若台湾回归,谁最有可能成为台湾省长?其中有四人众望所归

若台湾回归,谁最有可能成为台湾省长?其中有四人众望所归

文史旺旺旺
2024-06-20 17:23:16
2024-06-30 11:34:44
机器之心Pro
机器之心Pro
专业的人工智能媒体
9129文章数 141953关注度
往期回顾 全部

科技要闻

Meta低头,库克认错,XR设备还不相信高端

头条要闻

特朗普被问会否退出北约耸了耸肩 美媒:北约坐立不安

头条要闻

特朗普被问会否退出北约耸了耸肩 美媒:北约坐立不安

体育要闻

“意大利很弱”,不再是错觉了

娱乐要闻

白玉兰明星反应精彩 胡歌获奖唐嫣激动

财经要闻

A股上半年人均亏损1.2万 你亏了多少?

汽车要闻

小鹏MONA M03 7月3日首发 15万紧凑级

态度原创

时尚
家居
本地
教育
旅游

夏天少穿短裤、短裙,跟着气质女神穿衣服,才能美得优雅得体

家居要闻

美式风格 呈现田园风格

本地新闻

冷知识:东北雪糕才是最早的网红雪糕

教育要闻

贵州德江县一人去世,中学及卫生院全体职工排班守灵?教育局:非强制守灵是当地风俗习惯

旅游要闻

突发!上海出发豪华邮轮,男子翻越栏杆后落海

无障碍浏览 进入关怀版