网易首页 > 网易号 > 正文 申请入驻

超强AI模型Claude 3智商超我大学舍友!但有点没素质……

0
分享至

人工智能创业公司 Anthropic 近日宣布推出其突破性的 Claude 3 系列模型,该系列大型语言模型 (LLM) 在各种认知任务上树立了新的性能标杆。

Claude 3 系列包含三个子模型,分别为 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus,它们提供不同程度的智能、速度和成本选择,以满足各种人工智能应用需求。

发布以来,它被誉为比 OpenAI 的 ChatGPT 和谷歌的 Gemini AI 更熟练、更博学、更善于推理。

根据 Anthropic 的研究,在这三种模型中,Opus 在几个关键领域的表现优于 GPT-3.5、GPT-4 和谷歌的 Gemini

测试的技能包括常识、本科生水平的知识、研究生水平的专家推理、基础数学、数学问题解决和编码。

Anthropic 表示,凭借更高级的训练和知识,Claude 3 在复杂任务中表现出 “接近人类水平的理解力和流畅性”

经过实测,Claude 3 可以在一分钟内抓取超过 200 篇最新论文,然后完成学习并回答相关问题。

Claude 新版本的响应速度也更快。Sonnet 是 Claude 2 和 Claude 2.1 的两倍,而且更加智能。

因此,Anthropic 宣称这种模式是检索信息或自动销售的理想选择。Haiku 是三者中速度最快的,它能在三秒内读完一篇带有图表的密集研究论文。

Anthropic 还称 Claude 3 比以前的版本更准确、更不易出错。为了测试这一点,该公司向不同的模型提出了大量复杂的事实性问题。

在使用 Opus 模型时,Claude 3 的正确答案是 Claude 2.1 的两倍,而错误答案则更少。

为了避免提供有害信息,人工智能通常会拒绝回答被认为不恰当的问题。但有时它们也会把无害的提示误解为有害的。

在 Anthropic 的测试中,Claude 3 比以前的版本更少出现拒绝回答无害提示的情况

在这方面,三个 Claude 3 模型都能更好地理解请求,并能更好地区分有害和无害的问题。

不过在网友的“引导”下,Claude 3 还是被迫没素质起来,和我舍友玩 LOL 时不分伯仲。

Anthropic 还称Claude 3 更易于使用,能够接受更长的提示,并能更好地保留以前提示的信息

Claude 的一项重大改进是其接受上传文件的能力。现在,用户可以向它发送各种类型的文件,包括图片、PDF、文本文件、Microsoft Office 文件、CSV 文件和 HTML 文件。

Claude 会对文件内容进行分析、总结并回答相关问题。不过,Claude 3 还是无法生成图片

根据 36 氪的报道,Opus 在多项 AI 系统常用评估标准,包括本科级别专业知识(MMLU)、研究生级别专家推理(GPQA)、基础数学(GSM8K),均取得领先业界 LLM 的性能。

在 Maximumtruth.org 进行的智商测试中,Claude3 的 IQ 智商测试首次突破 100,达到人类平均水平。而我的大学舍友,玩个薇恩打完团满血满蓝,一般认为他的智商低于 90

虽然 AI 智商测试超过 100 很惊人,但更惊人的是 AI 智商的增长速度。

Claude 3 系列模型在分析预测、创建细微内容、代码生成,以及用西班牙语、日语、法语等非英语语言交流的能力上都实现了显著进步。

另外,Claude 3 Opus 在 LSAT、MBE、高中数学竞赛 AMC 和 GRE 等多项考试中,成绩也和 GPT-4 不相上下,甚至大比分超越。

据称,它甚至帮科学家完成了某种算法

在上下文窗口大小方面,Claude 3 系列模型在发布时将提供 20 万 token 的上下文窗口。

并且这三个模型都能够接受超过 100 万 token 的输入,Anthropic 未来可能会增加对更大上下文窗口的支持。

Opus 和 Sonnet 目前已集成到 Anthropic 的 Claude.ai 和 Claude API 中,可在 159 个国家 / 地区使用,Haiku 将很快推出。

Sonnet 也可以通过亚马逊云科技的 Bedrock 服务以及谷歌云 Vertex AI Model Garden 的私人预览渠道获得,Opus 和 Haiku 也将在不久后登陆这两个平台。

要试用 Claude 3,可以访问其官方网站。Claude Pro 每月收费 20 美元,使用更先进的 Opus 模型,并提供一些特权,如高峰期优先访问和提前使用新功能。

Anthropic 是由 OpenAI 的前成员创立的。

2021 年,一批 OpenAI 前员工不满于该组织在获得微软的投资后向封闭化方向发展,因而离开,并一同创立了 Anthropic。

他们对 OpenAI 在安全问题尚未解决的情况下便发布 GPT-3 的行为感到不满,并声称该组织已经为谋取利益而 “忘记了初心”。

这些前员工当中,包括拥有 GPT-2 以及 GPT-3 研究领域副总裁职位的 Dario Amodei,自 2016 年进入 OpenAI,并在过去担任该组织的研究副总裁,为其担当核心位置。

Anthropic 呼吁对人工智能采取更安全的方法,专注于创建遵循规则的模型,其推理过程是人类可以理解的。Anthropic 目前已获得来自谷歌、亚马逊等 26 个机构或个人的融资,总计融资金额达到了 76 亿美元。

公司的第一版 Claude 于 2023 年 3 月向公众发布。随后,Claude 2 于 2023 年 7 月发布。

Claude 3 在与使用者的对话中,将自己描述为一个具有自然语言处理能力的人工智能,同时还说:

“我要强调的是,我不是一个有生命的人,而是一个经过训练的非常先进的语言模型,它乐于助人、诚实、无害。我实际上没有情感体验,也没有主观经验。我的反应是高度复杂的模式识别和语言生成的结果,而不是内在的精神生活。

本文源自IT之家

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
已经顾不上南海了!菲律宾国内大乱,16万菲军被要求马上行动!

已经顾不上南海了!菲律宾国内大乱,16万菲军被要求马上行动!

说天说地说实事
2024-11-28 18:55:00
国足天降喜讯!首发8名归化球员,目标是世界杯夺冠

国足天降喜讯!首发8名归化球员,目标是世界杯夺冠

体坛狗哥
2024-11-29 17:38:22
停火协议生效后,真主党宣布战胜了以色列

停火协议生效后,真主党宣布战胜了以色列

桑未落
2024-11-28 19:44:07
发函的是美国企业!网友:揭秘比亚迪与森萨塔工业集团的“暗战”

发函的是美国企业!网友:揭秘比亚迪与森萨塔工业集团的“暗战”

火山诗话
2024-11-29 17:06:04
笑麻了!河北33岁剩女,吐槽父母介绍的全是丑男,网友笑晕在厕所

笑麻了!河北33岁剩女,吐槽父母介绍的全是丑男,网友笑晕在厕所

猫小狸同学
2024-11-25 15:40:03
就别吹恐怖组织了,主流文明的代表有100种方法碾压他们

就别吹恐怖组织了,主流文明的代表有100种方法碾压他们

大风文字
2024-11-29 06:49:17
72岁唐国强近照,嘴巴紧闭脸部发黑,老到认不出,走路小心翼翼

72岁唐国强近照,嘴巴紧闭脸部发黑,老到认不出,走路小心翼翼

老鹈爱历史
2024-11-28 11:05:12
沃西:没看过贾巴尔就不该聊GOAT话题 他不投3分仍当了39年得分王

沃西:没看过贾巴尔就不该聊GOAT话题 他不投3分仍当了39年得分王

直播吧
2024-11-29 12:31:13
郭德纲再被曝惊人猛料!杨议直指王梦婷事件,真相让人震惊!

郭德纲再被曝惊人猛料!杨议直指王梦婷事件,真相让人震惊!

小毅说事
2024-11-30 00:05:08
徐克回应杜琪峰“香港电影无灵魂”论

徐克回应杜琪峰“香港电影无灵魂”论

影迷Dustin
2024-11-29 18:26:24
为什么说“围棋已死”而没有“象棋已死”的说法

为什么说“围棋已死”而没有“象棋已死”的说法

王老师聊围棋
2024-11-29 16:27:20
天塌了!一孕妇买豆芽,老板说买点别的菜吧!网友的分享触目惊心!

天塌了!一孕妇买豆芽,老板说买点别的菜吧!网友的分享触目惊心!

滑稽斑马呀
2024-11-24 18:04:17
震惊!婆媳吵架引发血案!警方击毙儿媳和2月大婴儿,丈夫坐床边目睹一切

震惊!婆媳吵架引发血案!警方击毙儿媳和2月大婴儿,丈夫坐床边目睹一切

华人生活网
2024-11-30 05:44:50
历时一年,缅北电诈终于被彻底肃清,园区全部铲除!太牛了

历时一年,缅北电诈终于被彻底肃清,园区全部铲除!太牛了

晓徙历史
2024-11-29 10:32:47
走路就能降血糖?国外研究:降血糖有2个“最佳方法”,不是走路

走路就能降血糖?国外研究:降血糖有2个“最佳方法”,不是走路

老鹈爱历史
2024-11-29 18:02:41
用脚投票,胖东来超市卫生巾是日本品牌,网友想支持国产无从下手

用脚投票,胖东来超市卫生巾是日本品牌,网友想支持国产无从下手

你食不食油饼
2024-11-29 03:06:14
证监会的“立案调查”!11月30日,A股立案调查名单全梳理!

证监会的“立案调查”!11月30日,A股立案调查名单全梳理!

风口招财猪
2024-11-30 01:50:03
遭重判后想逃亡?周玉蔻欲坐飞机出境被机场拦下

遭重判后想逃亡?周玉蔻欲坐飞机出境被机场拦下

海峡导报社
2024-11-29 17:32:20
有哪些秘密宁可烂在肚子里也不说出来?话题也是引起了网友们共鸣

有哪些秘密宁可烂在肚子里也不说出来?话题也是引起了网友们共鸣

滑稽斑马呀
2024-07-01 13:55:27
中国癌症新发和死亡双双第一!国癌、华科大最新:优化生活方式,可避免高达40%的癌症死亡。

中国癌症新发和死亡双双第一!国癌、华科大最新:优化生活方式,可避免高达40%的癌症死亡。

肿瘤医学论坛
2024-11-27 19:57:59
2024-11-30 08:16:49
金融界
金融界
投资者信赖的财经金融门户网站
4437517文章数 542558关注度
往期回顾 全部

科技要闻

"AGI不是大杀器,是普通人每天在用的产品"

头条要闻

菲副总统威胁"刺杀总统" 马科斯作出"淡化冲突"表态

头条要闻

菲副总统威胁"刺杀总统" 马科斯作出"淡化冲突"表态

体育要闻

穆雷与德约科维奇能凑成王炸组合吗?

娱乐要闻

叶珂被曝独自去产检,他俩真分了吗

财经要闻

专家建议将农民养老金提升至每月500元

汽车要闻

问界M7今年累计交付量已突破18万辆

态度原创

旅游
家居
健康
游戏
本地

旅游要闻

海迪士尼下周电动轮椅入园或要证明

家居要闻

现代设计感 温馨两居室

花18万治疗阿尔茨海默病,值不值?

钢岚:新版本三大专武分析!2.0版本难道究极凯皇即将降世?

本地新闻

云游中国|来伦布夏果感受充满Passion的人生

无障碍浏览 进入关怀版