Baichuan4大模型
该AI大模型由百川智能投递并参与数据猿与上海大数据联盟联合推出的《2024中国数据智能产业AI大模型先锋企业》榜单/奖项”评选。
5月22日,百川智能发布最新一代基座大模型Baichuan 4,并推出成立之后的首款AI助手“百小应”。Baichuan 4相较Baichuan 3 在各项能力上均有极大提升,其中通用能力提升超过10%,数学和代码能力分别提升14%和9%,在国内权威大模型评测机构SuperCLUE的评测中,模型能力国内第一。此外,Baichun 4还具备行业领先的多模态能力,在各大评测基准上表现优异,领先Gemini Pro、Claude3-sonnet等多模态模型。
应用场景/使用群体
在Baichuan 4强大能力的基础上,百川智能将搜索技术与大模型深度融合,推出懂搜索、会提问的AI助手“百小应”。百小应不仅可以随时回答用户提出的各种问题,速读文件、整理资料、辅助创作等,还具备多轮搜索、定向搜索等搜索能力,能更精准地理解用户需求,为用户提供专业、丰富的知识和资源。此外还会在用户问题的基础上通过一系列提问来帮助用户明确自身需求,给出更精准的答案。百小应现在已经在Web端(ying.ai)及移动端各大应用商店同步上线。
此外,百川智能还宣布开放Baichuan 4、Baichuan3-Turbo、Baichuan3-Turbo-128k、Assistant API四款API,所有开发者、企业用户均可登录百川智能开发者中心选择并接入相应API,便捷高效地体验百川智能新一代模型的强大能力。(开发者体验中心:https://platform.baichuan-ai.com/playground)
产品功能
“百小应”是百川智能成立之后推出的首款AI应用。很好地融合了Baichan 4行业领先的通用能力与百川智能前沿的搜索技术,具备多步搜索、智能定向搜索等能力,将百小应打造成一款懂搜索、会提问的AI助手。
多轮搜索指的是针对用户提出的问题,百小应逐步解析,深入探究,解锁问题的核心答案。相比单轮搜索,在市场调研、产业分析等复杂场景下,多轮搜索能够有效地获取更专业、更有深度的信息。定向搜索则能让百小应精准定位问题领域,直接访问权威站点,快速、准确的找到相关信息。
在搜索结果呈现方面,百小应同样与其他在单次搜索后“简单总结网页信息”的应用不同,它是将搜索结果作为观点、论据直接应用到问答结果中。与此同时,其结果的结构化也非常优秀,能够将搜索结果以表格等结构化形式呈现,优化信息布局,便于用户快速定位、解读所需信息,可以为行业分析、调研工作提供强大助力。此外,还在搜索结果中增加了来源参考,用户只需点击引用角标即可快速校验搜索结果,十分便捷。
针对一部分用户无法明确表述出自身需求,或者问题过于笼统、抽象的情况,百小应还贴心的用提问功能构建了个性化解决方案,百小应会在用户问题的基础上通过一系列提问来帮助用户明确自身需求,然后再给出更精准的答案。
除了强大的搜索和提问功能以外,用户还能在百小应中上传PDF、word文档,或者直接输入网页链接(URL),阅读并分析书籍、报告、学术论文等长篇内容,仅用一分钟便能读完上市公司财报。在Baichuan 4多模态能力的支持下,用户在提问的同时还可以同步上传图片,对图片内容进行解读,或者将图片作为补充材料,获取更精准的回答;并且,它还支持用户通过语音的方式进行交互。
模型能力
Baichuan 4在国内权威大模型评测机构SuperCLUE的评测中,模型能力国内第一,相较上一代大模型Baichuan 3提升显著。与国外主流大模型对比,Baichuan4在知识百科、长文本、生成创作等文科类中文任务上明显优于国外大模型。
与国外主流大模型对比,Baichuan4在知识百科、长文本、生成创作等文科类中文任务上明显优于国外大模型。
此外,Baichuan 4还具备行业领先的多模态能力,在MMMU、MMBench-EN、CMMMU、MMBench-CN、MathVista等评测基准上表现优异,大幅领先Gemini Pro、Claude3-sonnet等多模态模型。
技术说明
Baichuan 4能在较短的时间内取得突破,源于其在训练过程中引入了诸多业界领先的技术优化手段。例如,在预训练阶段采用了基于Model-based+Human-based的协同数据筛选优化方法,以及对长文本建模位置编码科学的Scaling Law,有效提升了模型对数据的利用;在对齐阶段重点优化了模型Reasoning、Planning、Instruct following能力,通过loss驱动的数据选取与训练,多阶段爬坡,多模型参数融合等方式有效提升了模型的关键指标和稳定性。同时突破RLHF和RLAIF融合的RLxF强化学习对齐技术,大幅提升模型的指令遵循等能力。
服务客户
百小应主要针对C端用户,目前已经在Web端(ying.ai)及移动端各大应用商店同步上线。
关于企业
·百川智能
百川智能是一家研发通用人工智能并提供相关服务的中国公司,核心业务是打造基础大模型及其颠覆性上层应用,由搜狗公司创始人王小川创立,成立于 2023 年 4 月 10 日。公司核心团队由数十位前搜狗、百度、华为、微软、字节、腾讯等知名科技公司的 AI 顶尖人才组成。百川智能致力于帮助大众轻松普惠地获取世界知识和专业服务。目前已完成 A1 轮战略融资,总融资金额达 3.5 亿美元。创立半年跻身科技独角兽行列,创下国内大模型初创企业最快记录。
成立以来,百川智能接连发布 Baichuan-7B/13B,Baichuan2-7B/13B 四款开源可免费商用大模型及 Baichuan-53B、Baichuan2-53B、Baichuan2-192K、Baichuan2 Turbo、鹏城-百川·脑海 33B、Baichuan-NPC、Baichuan 3 七款闭源大模型。其中 Baichuan-7B/13B 两款大模型在多个权威评测榜单均名列前茅,累积下载量突破七百万次。Baichuan 2 更是在各维度全面领先Llama 2,引领了中国开源生态发展。2023 年 8 月 31 日,百川智能通过《生成式人工智能服务管理暂行办法》备案,是首批中唯一一家初创大模型公司。9 月 25 日,开放 Baichuan API 接口,正式进军 To B 领域,开启商业化进程。10 月 30 日,发布 Baichuan2-192K 大模型,上下文窗口长度高达 192K,一次能够处理约 35 万个汉字。11 月 16 日,与鹏城实验室宣布携手探索大模型训练和应用,合作研发基于国产算力的 128K 长窗口大模型“鹏城-百川·脑海 33B”。12 月 19 日,发布基于搜索增强的 Baichuan2-Turbo 系列API,开启企业定制化新生态。2024 年 1 月 9 日,发布 Baichuan-NPC 角色模型,零代码复刻角色轻松满足游戏领域定制需求。1 月 29 日,发布超千亿参数模型 Baichuan 3,基础通用能力全面提升,逻辑推理和语义理解能力显著增强,在医疗和诗词创作领域表现突出。5 月 22 日发布 Baichuan 4,并推出首款 AI 助手“百小应”。Baichuan 4 相较 Baichuan 3 在各项能力上均有极大提升,其中通用能力提升超过 10%,数学和代码能力分别提升 14% 和 9%,在国内权威大模型评测机构 SuperCLUE 的评测中,模型能力国内第一。
★以上由百川智能投递申报的项目案例,最终将会角逐由数据猿与上海大数据联盟联合推出的《2024中国数据智能产业AI大模型先锋企业》榜单/奖项。
该榜单奖项最终将于7月24日以下活动中进行榜单的首发与奖项的颁发,欢迎报名莅临现场
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.