继此前在上月马斯克透露AI大模型Grok-2将于8月发布后,日前xAI方面宣布,正式推出Grok-2和Grok-2 mini的Beta版本。据xAI方面透露,Grok-2是其上一代大模型Grok-1.5的重大升级,在聊天、编码和推理方面具有更前沿的能力,而Grok-2 mini则被描述为“体型虽小、但功能强大的兄弟产品”,可在速度和回答质量之间取得平衡。此外,Grok-2在对检索到的内容进行推理,以及工具使用能力方面有着显著的改进,例如正确识别缺失信息、通过事件序列进行推理,以及丢弃不相关的信息等。
据xAI方面公布的信息显示,已在LMSYS聊天机器人竞技场中引入了名为“sus-column-r”的Grok-2早期版本,该模型的Elo总分已超过Claude和GPT-4。同时Grok-2和Grok-2 mini在研究生水平科学知识(GPQA)、常识(MMLU、MMLU-Pro)和数学竞赛问题(MATH)等领域的表现,均能与其他同类模型相媲美。而在视觉数学推理(MathVista)和基于文档的问答(DocVQA)方面,Grok-2则提供了最先进的性能。
值得一提的是,目前Grok-2和Grok-2mini的测试版已在X平台(原推特)面向其Premium和Premium+订阅用户开放。同时xAI方面还标识,计划在本月晚些时候通过新的API面向开发人员提供这两款大模型,以及“我们即将推出的API基于全新的定制技术堆栈,允许多区域推理部署、可实现全球低延迟访问。此外还提供了增强的安全功能,如强制性多因素身份验证(如使用Yubikey、Apple TouchID或TOTP)、丰富的流量统计和高级计费分析(包括详细的数据导出)”。
xAI方面透露,很快将发布具有多模态理解能力的Grok-2和Grok-2 mini预览版,并作为用户在X平台和API上体验Grok系列模型的核心部分。
【本文图片来自网络】
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.