速递｜Meta 正式发布 Llama3！更有 Llama3 版 Meta AI 免费使用|ai|meta|软件安装包

速递｜Meta 正式发布 Llama3！更有 Llama3 版 Meta AI 免费使用

2024-04-19 08:34:51　来源: 有新Newin

浙江举报

分享至

今天凌晨，Meta 发布了 Llama 3 系列中两个开源模型—— 8B 和 70B，其余模型将在未来的某个时间点发布。

Meta 描述了这些新模型——Llama 3 8B（含 80 亿参数）和 Llama 3 70B（含 700 亿参数），与上一代 Llama 模型（Llama 2 8B 和 Llama 2 70B）相比，在性能上是一个“重大飞跃”。

Meta 表示，就其各自的参数数量而言，Llama 3 8B 和 Llama 3 70B —— 在两个定制的 24,000 GPU 集群上训练，是目前表现最佳的生成式 AI 模型之一。

Llama 3 8B 在至少九个基准测试中击败了其他开源模型，如 Mistral 的 Mistral 7B 和 Google 的 Gemma 7B，这两者都含有 70 亿参数：MMLU、ARC、DROP、GPQA（一组与生物学、物理学和化学相关的问题）、HumanEval（代码生成测试）、GSM-8K（数学问题）、MATH（另一个数学基准测试）、AGIEval（解决问题的测试集）和 BIG-Bench Hard（常识推理评估）。

现在，Mistral 7B 和 Gemma 7B 并不完全处于领先地位（Mistral 7B 是去年九月发布的），而在 Meta 引用的一些基准测试中，Llama 3 8B 与它们的得分仅相差几个百分点。但 Meta 表示，参数数量更大的 Llama 3 模型，即 Llama 3 70B，与旗舰生成式 AI 模型（包括 Google Gemini 系列的最新版本 Gemini 1.5 Pro）具有竞争力。

Llama 3 70B 在 MMLU、HumanEval 和 GSM-8K 上击败了 Gemini 1.5 Pro，虽然它不及 Anthropics 最优秀的模型 Claude 3 Opus，但在五个基准测试（MMLU、GPQA、HumanEval、GSM-8K 和 MATH）上，Llama 3 70B 的得分优于 Claude 3 系列中最弱的模型 Claude 3 Sonnet。

此外，Meta 还开发了自己的测试集，涵盖从编码和创作写作到推理和摘要等用例，Llama 3 70B 在 Mistral 的 Mistral Medium 模型、OpenAI 的 GPT-3.5 和 Claude Sonnet 中表现出色。

Meta 表示，新 Llama 模型的用户应该期待更高的“可控性”，更低的拒绝回答问题的可能性，以及在琐事问题、历史问题和工程学科、科学学科等 STEM 领域以及一般编码建议上更高的准确性。部分原因在于数据集的规模更大：包含 15 万亿个令牌的集合，或者说是令人惊叹的约 7500 亿字 —— 是 Llama 2 训练集规模的七倍。（在 AI 领域，“令牌”指的是原始数据的细分部分，比如单词“fantastic”中的音节“fan”、“tas”和“tic”）。

Meta 没有透露数据来源，仅表示它来自“公开可用的来源”，包括比 Llama 2 训练数据集多四倍的代码，其中 5% 的数据集含有非英语数据（约 30 种语言），以提高在非英语语言上的性能。

此外，Meta 还表示，他们使用了合成数据 —— 即 AI 生成的数据 —— 来创建更长的文档，供 Llama 3 模型训练。

关于毒性和偏见，Meta 表示他们开发了新的数据过滤管道，提高了模型训练数据的质量，并更新了其两款生成式 AI 安全套件，Llama Guard 和 CybersecEval，以尝试防止 Llama 3 模型和其他模型的误用和不必要的文本生成。该公司还发布了一款名为 Code Shield 的新工具，旨在检测生成式 AI 模型可能引入的代码安全漏洞。

Llama 3 模型现在已经可以下载，并驱动 Meta 在 Facebook、Instagram、WhatsApp、Messenger 和网络上的 Meta AI 助手 —— 将很快以托管形式部署在包括 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM 的 WatsonX、Microsoft Azure、Nvidia 的 NIM 和 Snowflake 在内的广泛的云平台上。未来，针对 AMD、AWS、Dell、Intel、Nvidia 和 Qualcomm 硬件优化的版本也将推出。

目前，正在训练参数规模超过 4000 亿的 Llama 3 模型 —— 这些模型具有“多语言对话”的能力，可以接受更多的数据并理解图像和其他模态以及文本，这将使 Llama 3 系列与 Hugging Face 的 Idefics2 等开放发布保持一致。

未来，Llama 3 将具备多语言和多模态能力，拥有更长的上下文，并持续改进核心的大型语言模型能力，如推理和编码。

除了 Llama3 模型以外，Meta 还发布了其 AI 助手——Meta AI，目前正在全球范围内推广，并增添更多功能。

据悉，Meta AI 由最新的 Meta Llama 3 驱动，现已内置于手机中，随时可以免费使用。Meta AI 首次在去年的 Connect 大会上公布，现在，全球越来越多的人可以以更多方式与之互动。

Meta AI 目前已在超过十几个国家推出英语服务，这些国家包括澳大利亚、加拿大、加纳、牙买加、马拉维、新西兰、尼日利亚、巴基斯坦、新加坡、南非、乌干达、赞比亚和津巴布韦，并且这只是开始。

如果你计划与朋友外出晚餐，可以请 Meta AI 推荐一家有日落景观和素食选项的餐厅。如果你在组织周末度假，可以询问 Meta AI 周六晚上的音乐会。如果您在为考试做准备，可以请 Meta AI 解释遗传特征是如何工作的。如果你正在搬入第一个公寓，可以让 Meta AI “想象”您想要的美学风格，并为你的家具购物生成一些灵感照片。

我们还希望在你使用电脑时也能使用 Meta AI，打开网站 meta.ai，无论是在数学问题上需要帮助，还是希望工作邮件听起来更专业，Meta AI 都能提供帮助，并且您可以登录保存与 Meta AI 的对话：

Meta AI 也可在 Facebook、Instagram、WhatsApp 和 Messenger 的搜索与信息流中使用，你可以从网络上获取实时信息，无需在应用程序之间切换。

此外，Meta 页正在加快图像生成的速度，使用 Meta AI 的 Imagine 功能实时从文本创建图像，今天开始可以在 WhatsApp 和 Meta AI 网页体验中以 beta 版本推出此功能。

只需输入几个字母，就可以看到图像的生成，并随着继续输入而变化，生成的图像现在也更清晰、质量更高，更能够在图像中包含文本。从专辑封面到婚礼标牌、生日装饰到服装灵感，Meta AI 能够更快更好地生成图像，将构想变为现实。

这些更新特定于 Facebook、Instagram、WhatsApp、Messenger 和网页上的 Meta AI，Meta AI 在美国的 Ray-Ban Meta 智能眼镜上也可用，并即将推向 Meta Quest。

PS：回顾 2023 年至今，大部分 AI 炒作都集中在基础模型的横向能力上，但 AI 的真正机会在于，。

Newin 行业交流群

最新活动

1、，报名方式请点击下方海报：

2、「AI 天使汇」联合 150 家顶级基金/站投将举办新一轮 AI 创业项目路演活动，征集优秀创业者报名参与，报名方式如下：

最新资讯

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.