今天凌晨,Meta 发布了 Llama 3 系列中两个开源模型—— 8B 和 70B,其余模型将在未来的某个时间点发布。
Meta 描述了这些新模型——Llama 3 8B(含 80 亿参数)和 Llama 3 70B(含 700 亿参数),与上一代 Llama 模型(Llama 2 8B 和 Llama 2 70B)相比,在性能上是一个“重大飞跃”。
Meta 表示,就其各自的参数数量而言,Llama 3 8B 和 Llama 3 70B —— 在两个定制的 24,000 GPU 集群上训练,是目前表现最佳的生成式 AI 模型之一。
Llama 3 8B 在至少九个基准测试中击败了其他开源模型,如 Mistral 的 Mistral 7B 和 Google 的 Gemma 7B,这两者都含有 70 亿参数:MMLU、ARC、DROP、GPQA(一组与生物学、物理学和化学相关的问题)、HumanEval(代码生成测试)、GSM-8K(数学问题)、MATH(另一个数学基准测试)、AGIEval(解决问题的测试集)和 BIG-Bench Hard(常识推理评估)。
现在,Mistral 7B 和 Gemma 7B 并不完全处于领先地位(Mistral 7B 是去年九月发布的),而在 Meta 引用的一些基准测试中,Llama 3 8B 与它们的得分仅相差几个百分点。但 Meta 表示,参数数量更大的 Llama 3 模型,即 Llama 3 70B,与旗舰生成式 AI 模型(包括 Google Gemini 系列的最新版本 Gemini 1.5 Pro)具有竞争力。
Llama 3 70B 在 MMLU、HumanEval 和 GSM-8K 上击败了 Gemini 1.5 Pro,虽然它不及 Anthropics 最优秀的模型 Claude 3 Opus,但在五个基准测试(MMLU、GPQA、HumanEval、GSM-8K 和 MATH)上,Llama 3 70B 的得分优于 Claude 3 系列中最弱的模型 Claude 3 Sonnet。
此外,Meta 还开发了自己的测试集,涵盖从编码和创作写作到推理和摘要等用例,Llama 3 70B 在 Mistral 的 Mistral Medium 模型、OpenAI 的 GPT-3.5 和 Claude Sonnet 中表现出色。
Meta 表示,新 Llama 模型的用户应该期待更高的“可控性”,更低的拒绝回答问题的可能性,以及在琐事问题、历史问题和工程学科、科学学科等 STEM 领域以及一般编码建议上更高的准确性。部分原因在于数据集的规模更大:包含 15 万亿个令牌的集合,或者说是令人惊叹的约 7500 亿字 —— 是 Llama 2 训练集规模的七倍。(在 AI 领域,“令牌”指的是原始数据的细分部分,比如单词“fantastic”中的音节“fan”、“tas”和“tic”)。
Meta 没有透露数据来源,仅表示它来自“公开可用的来源”,包括比 Llama 2 训练数据集多四倍的代码,其中 5% 的数据集含有非英语数据(约 30 种语言),以提高在非英语语言上的性能。
此外,Meta 还表示,他们使用了合成数据 —— 即 AI 生成的数据 —— 来创建更长的文档,供 Llama 3 模型训练。
关于毒性和偏见,Meta 表示他们开发了新的数据过滤管道,提高了模型训练数据的质量,并更新了其两款生成式 AI 安全套件,Llama Guard 和 CybersecEval,以尝试防止 Llama 3 模型和其他模型的误用和不必要的文本生成。该公司还发布了一款名为 Code Shield 的新工具,旨在检测生成式 AI 模型可能引入的代码安全漏洞。
Llama 3 模型现在已经可以下载,并驱动 Meta 在 Facebook、Instagram、WhatsApp、Messenger 和网络上的 Meta AI 助手 —— 将很快以托管形式部署在包括 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM 的 WatsonX、Microsoft Azure、Nvidia 的 NIM 和 Snowflake 在内的广泛的云平台上。未来,针对 AMD、AWS、Dell、Intel、Nvidia 和 Qualcomm 硬件优化的版本也将推出。
目前,正在训练参数规模超过 4000 亿的 Llama 3 模型 —— 这些模型具有“多语言对话”的能力,可以接受更多的数据并理解图像和其他模态以及文本,这将使 Llama 3 系列与 Hugging Face 的 Idefics2 等开放发布保持一致。
未来,Llama 3 将具备多语言和多模态能力,拥有更长的上下文,并持续改进核心的大型语言模型能力,如推理和编码。
除了 Llama3 模型以外,Meta 还发布了其 AI 助手——Meta AI,目前正在全球范围内推广,并增添更多功能。
据悉,Meta AI 由最新的 Meta Llama 3 驱动,现已内置于手机中,随时可以免费使用。Meta AI 首次在去年的 Connect 大会上公布,现在,全球越来越多的人可以以更多方式与之互动。
Meta AI 目前已在超过十几个国家推出英语服务,这些国家包括澳大利亚、加拿大、加纳、牙买加、马拉维、新西兰、尼日利亚、巴基斯坦、新加坡、南非、乌干达、赞比亚和津巴布韦,并且这只是开始。
如果你计划与朋友外出晚餐,可以请 Meta AI 推荐一家有日落景观和素食选项的餐厅。如果你在组织周末度假,可以询问 Meta AI 周六晚上的音乐会。如果您在为考试做准备,可以请 Meta AI 解释遗传特征是如何工作的。如果你正在搬入第一个公寓,可以让 Meta AI “想象”您想要的美学风格,并为你的家具购物生成一些灵感照片。
我们还希望在你使用电脑时也能使用 Meta AI,打开网站 meta.ai,无论是在数学问题上需要帮助,还是希望工作邮件听起来更专业,Meta AI 都能提供帮助,并且您可以登录保存与 Meta AI 的对话:
Meta AI 也可在 Facebook、Instagram、WhatsApp 和 Messenger 的搜索与信息流中使用,你可以从网络上获取实时信息,无需在应用程序之间切换。
此外,Meta 页正在加快图像生成的速度,使用 Meta AI 的 Imagine 功能实时从文本创建图像,今天开始可以在 WhatsApp 和 Meta AI 网页体验中以 beta 版本推出此功能。
只需输入几个字母,就可以看到图像的生成,并随着继续输入而变化,生成的图像现在也更清晰、质量更高,更能够在图像中包含文本。从专辑封面到婚礼标牌、生日装饰到服装灵感,Meta AI 能够更快更好地生成图像,将构想变为现实。
这些更新特定于 Facebook、Instagram、WhatsApp、Messenger 和网页上的 Meta AI,Meta AI 在美国的 Ray-Ban Meta 智能眼镜上也可用,并即将推向 Meta Quest。
PS:回顾 2023 年至今,大部分 AI 炒作都集中在基础模型的横向能力上,但 AI 的真正机会在于,。
Newin 行业交流群
最新活动
1、 , 报名方式请点击下方海报:
2、「AI 天使汇」联合 150 家顶级基金/站投将举办新一轮 AI 创业项目路演活动,征集优秀创业者报名参与,报名方式如下:
最新资讯
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.