日前,面壁智能方面宣布推出MiniCPM3.0-4B开源大模型,并号称“端侧ChatGPT时刻到来”。据悉,MiniCPM3.0-4B是面壁智能旗下MiniCPM系列的第三代产品,相比前两代产品拥有更强大、更多用途的技能集。此外,该模型还具备上下文“无限”拓展、GPT-4o级Function Calling(函数调用)与超强RAG(检索增强生成)等特征。
据面壁智能方面介绍,MiniCPM3.0-4B拥有32k上下文窗口,借助LLMxMapReduce(长文本分帧处理)技术,在不需要占用太高内存的情况下,可处理理论上的无限上下文长度。具体而言,该技术通过将长上下文切分为多个片段,让模型并行处理,并从不同片段中提取关键信息、汇总最终答案,从而实现无限长文本处理。值得一提的是,这一技术在文本不断加长的情况下,仍然能保持稳定性能,以及减少长文本随加长而掉分的情况。
此外,MiniCPM3.0-4B的量化后内存仅2GB,与云端模型相比,天然就具有弱网断网可用、超低时延、数据隐私安全等优势。面壁智能方面表示,尽管该模型仅为4B参数,但其整体性能在自然语言理解、知识、代码数学等多项能力上,已对GPT-3.5实现赶超,并在基准测试中以超过Qwen2-7B、Phi-3.5、GLM4-9B、LLaMa-8B等一众知名模型的表现脱颖而出。
除MiniCPM3.0-4B以外,面壁智能还一并发布了检索模型MiniCPM-Embedding、重排序模型MiniCPM-Reranker,以及经Lora(Long-term Recurrent Architecture)训练的微调模型MiniCPM3-RAG-LoRA三个端侧模型RAG套件。
不久前,面壁智能方面还与大象机器人达成合作协议,将MiniCPM端侧模型植入仿真陪伴宠物机器人metaCat米塔猫。据悉,高效端侧模型能够显著提升仿真机器宠物“类声明体”的智能交互体验,即不依赖网络、不需要复杂的硬件改造,以更自由更自然的交互让机器萌宠触发声、光、电、动作响应,仿真感更强、情感陪伴更加逼真。
【本文图片来自网络】
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.