全民裁判AI模型实力，字节扣子启动匿名竞技场|ai|编程|大模型|工作流

全民裁判AI模型实力，字节扣子启动匿名竞技场

2024-06-13 22:50:52　来源: AI大模型工场

北京举报

分享至

作者｜清川

编辑｜方奇

媒体｜AI大模型工场

苹果和OpenAI的联手让我们看到了一个新的AI定义“Apple Intelligence”，让AI更懂你。

但是这种只停留在了表面，缺少了实际的应用，更没有看到杀手级应用的出现。

高昂的训练成本和技术难度一直是制约AI应用的两大难题。长期以来，AI被视为仅限于大型企业和科研机构的高端领域，它的实际应用则多囿于搜索引擎优化和图像编辑等狭窄范畴。

前段时间，大模型降价潮来袭，各家模型价格卷到飞起。实际上，这轮公有大模型降价很大程度是为了吸引开发者，让更多的开发者参与到应用的开发中，但普通人离大模型应用还很远。

但总的来说，大模型要作为商业产品，不仅要让大家易上手，更要降低开发成本和时间成本。

在2024大模型应用场景之年，大家都在期待着“杀手级应用”的出现。就是在这样的背景下，一些新兴平台，如扣子，正试图通过提供更易用的AI搭建工具，降低技术门槛，让AI技术的应用变得简单，好上手。

让开发者能够如同抖音创作者一样，百花齐放，最后形成一个大模型应用的生态。

而在模型广场，用户可以直接让不同大模型进行PK对决，让普通人真正感受到大模型应用的魅力。

那么像字节扣子模型广场，是如何做到让人人都会做大模型应用的，在未来扣子又能做成怎样的大模型应用生态？

人人都是大模型应用开发者

门槛低和能力强才是关键

在低代码的发展中，流行着一句话：人人都是低代码开发者。这一理念已经成功跨越多个行业，有效解决了不同场景下的挑战。

那么，对于大模型而言，是否存在一个人人都可搭建的平台，生长出不同有用又有趣的应用？

而扣子，恰恰就是这样一个平台，专注于连接大模型和用户场景，服务于新一代的AI应用开发。

扣子平台的魅力在于其低门槛的开放性。无论你是否具备编程基础，你都能够在这里快速搭建出基于大模型的各类Bot，并轻松将其发布到各大社交平台、通讯软件，或部署到网站等多元渠道。

这种低门槛的开放方式，让AI离应用更近了一步，而能力强也是大模型应用的一个关键。新时代的开发者，范围将因此扩大很多。

在home bot主界面，只需简单输入“我想做一个找资料的Bot”，即可轻松创建一个专属于自己的资料搜索专家。

招商银行用来分析市场bua行情的“财富看点”Bot，猎聘的“找工作助手”Bot，复旦大学的《生态学》课程的辅导助手。浙江大学的物理实验助教“小理”，各行各业都在选择使用扣子创建AI Bot。

显而易见，扣子平台提供了易于使用的工具和环境，使用户能够借助大语言模型的强大能力，快速构建和部署各种AI应用。

理想中的AI Bot，通过模拟人类对话和提供智能服务，能逐渐成为各行业提升效率、改善用户体验的重要工具。

法小理Bot能为你提供一份详细的离婚协议模板，5分钟阅读Bot能介绍每首诗歌或散文的创作背景及其背后的故事，简单输入“职场复仇”的题材和风格，就能生成一本完整的精品爽文小说。

目前，扣子平台的Bot商店里，已汇聚了各式各样的AI Bot。从个人爱好者到企业用户，从休闲娱乐到办公助手，从专业技术开发者到小朋友，即使没有编程基础，也可以在扣子上创建和使用基于大模型的Bot。

在今年5月的火山引擎发布会上，扣子产品经理潘宇扬曾分享这样一个案例：一位五年级的小朋友，仅用学校中学到的语文知识，就在扣子平台上创建了自己的英语外教AI Bot。

在快递行业里，都在发愁，谁能真正解决最后一公里的问题，而在目前大模型发展中，谁能解决大模型的“应用一分钟”，这或许才是大模型的真正意义，模型再大，用户用不上一分钟，也等于没用。扣子可能会让大家看到更多真实场景，让应用成为主流。

多家大模型一键battle

模型广场直接检验应用能力

尽管Bot商店的一些AI Bot功能尚待完善，扣子却一直努力走在AI开发者生态前头。全民玩AI的时代已经来了，大模型已经足够多了，那么谁才是更好用地那一个？

要如何高效地使用大模型，扣子的模型广场给出了答案，而要更简单地上手对比体验。

目前扣子已经接入了多个国内知名大语言模型，包括豆包、通义千问、GLM-4、MiniMax、Moonshot、Baichuan4，用户可以在创建Bot时一键切换不同模型。

实际上，当前并没有一个全面万能的大模型。每个大模型都有其独特的优势和专长，也因此众多业内人士预测MOE模型或将很长一段时间成为未来大模型发展的主流趋势。

Bot开发不只是技术实现的问题，它还涉及商业策略、用户体验设计、成本控制等多个关键方面。选择合适的模型是确保Bot开发成功的关键因素之一。

为此，扣子平台提供了模型广场这样一个在线大模型对比与评估系统，帮助开发者选择最合适的大模型。

具体而言，来到扣子模型广场，开发者可以根据项目需求（比如行业特性、功能需求、性能要求等），选择最适合的AI模型。

除了提供专业客观的技术支持，扣子平台的对战模式还为开发者提供了一个直观的工具，用以比较不同模型的性能和特点。

进一步理解对战模式，也就是扣子模型广场的对战功能，允许开发者在特定场景下测试不同模型的表现。

想象你要为你的宠物店开发一个智能助手Bot，来帮助顾客解答关于宠物护理的问题。

那么打开扣子的官网（coze.cn），点击左侧的导航栏“探索”列表中“模型广场”，便可开始体验了。

在这里，你会发现三种不同的对战模式。分别是随机开始，纯模型对战，以及选一个Bot进行对战。

假设，你选择了指定Bot对战，并且已经选定一个叫“喵星人”的Bot

为了测试“喵星人”在猫知识方面的专业性，扣子将安排“喵星人”与随机的AI模型进行对战。

在这场对决中，各个Bot会基于Promt、工作流、知识库等能力，回答同一个问题，比如：“猫咪一天需要遛几次？

显然，在这个案例中，大模型B表现得更好。

当你完成投票后，大型模型的真实身份也将揭晓，分别是GLM-4（A）和MiniMax6.5s（B）。

指定Bot对战，用来评估特定Bot在专业领域的表现；相对而言，随机Bot对战，侧重评估模型在随机场景的通用能力；而纯模型对战则专注于评估模型自身的基础文本生成能力。

但无论如何，通过这些对战测试，你可以深入了解不同AI模型在实际应用中的性能和适用性，进而做出更合理的技术选型和应用开发决策，不断优化和升级你的宠物店Bot。

全民受用的AI应用

究竟会是什么样的？

当你踏入扣子的“Bot商店”，就会发现这里的Bot们并非单调乏味的存在，它们与时代文化同步，随着热点趋势不断演变，展现了不一样的创新氛围。

创造优化Bot的过程是复杂各异的，但所有这些努力都是为了一个共同的目标：提升用户体验。

除了通过上线模型广场吸引不同背景的用户来构建Bot，并通过匿名测试评选更适合Bot大模型之外，扣子还做出了一系列努力来提升用户体验。

为了拓展 Bot 的各种技能，扣子提供了插件、工作流、图像流、触发器；而为了让Bot更加个性化，扣子提供了长期记忆、数据库和文件盒子等工具，让Bot能够记住用户的喜好和重要信息。

还是引用扣子产品经理潘宇扬的理解：无论是旅行中发现的美味葡萄酒，还是日常中的点滴想法，Bot都能一一捕捉，并为用户提供贴心推荐。

从早晨的天气查询、通勤规划，到工作时的邮件分析，再到下班后的娱乐推荐和轻松对话，Bot都能成为你生活中的得力助手和忠实伙伴。

AI Bot已经在各行各业展现了独特价值，不过技术的演进从来都是一个持续的过程。事实上，由于技术难度和市场情况不同，AI应用不同领域的竞争格局已经出现了明显的区别。

在技术门槛较低、模型发展成熟的领域，如文字和图片生成，模型间的差异逐渐缩小。未来，关键在于如何深入挖掘特定使用场景，提供定制化的解决方案，以更好地满足用户需求。

Data.ai的数据显示，2023年12月AI相关应用的下载量达到9300万次，全年移动端下载总量达到8.1亿次，同比增长652%。这一显著的增长不仅反映了市场对AI技术的高度认可，也突显了AI技术的广泛应用潜力。

实际上，从宏观层面看，大模型的应用的爆发点也就是AI普惠点。就像微信、抖音这些全民级APP是在4G普及和安卓千元机普及后出现的，AI也将在扣子这类AI开发平台的加持下迎来一个全民可开发、可使用的时代。

更重要的是，AI的未来更将是一个不断自我完善、不断情感和认知层面与人类建立更深层次联系的过程。这不仅是技术的革新，更是人类生活方式的一次深刻变革。

回到最后的问题，全民受用的AI工具将不只是执行命令的机器，而应成为具备高度自适应性、预测性和个性化服务能力的智能体，深入理解并满足人类需求。

至少，在目前的大模型应用里，扣子正在走自己独特的一条道路，更简单，更开放，更好用。

在生态建设的语境下，扣子模型广场为使用者提供了一种低门槛、低成本的模型竞争与比较机制。当用户在面对众多大模型选择而犹豫不决时，这种机制为他们提供了更为明晰的选择。

只有当这些应用足够多，跑出来的数据足够好用，并且这些应用间能形成协同效应，共同解决问题时，整个应用生态才会焕发出更为蓬勃的生命力，从而孕育出杀手级的创新应用。就像抖音的创作者一样，大家都在追求内容的极致，才能产生更好的内容，才能做好协同。

写在最后：扣子联合Intel 推出了“扣子AI工坊”（Coze AI Factory）活动，这是扣子与英特尔共同推出的一场主题Bot征集盛会。活动专注于图文创作、实用工具、互动创意这三个赛道，有想法、感兴趣的读者可以参加。

AIGC大模型工场已经组织了非常精准的「AI大模型垂直社群」，覆盖超1000位AIGC圈，百度大模型业务负责人，京东大模型业务负责人，腾讯大模型业务人，阿里云大模型技术负责人，科大讯飞大模型公关，商汤大模型业务，阅文大模型公关，360大模型公关负责人都在群里啦，欢迎大模型业务负责人加入。请加微信fqq2000nian ，注明真实身份。

数据支持天眼查，大模型独家合作账号

监制 / 刘老师

编辑 / AIGCCCCC

视觉 / 大模型

微博 / @AI大模型工场

TG/AI Marketing Field

大模型应用创业者，你怎么看？

■ 百度文心一言，阿里通义千问 ▍通用大模型案例

■ 科大讯飞星火京东 ▍产业大模型案例

■ 商汤日日新、腾讯，昆仑万维 ▍ 金融大模型案例

■ 盘古大模型，中国电信，医联 ▍医疗大模型案例

■阅文大模型，腾讯音乐大模型 ▍ 文娱大模型案例

■知乎，360大模型，火山引擎 ▍ 教育大模型案例

■ 网易，金山办公大模型 ▍ 更多行业大模型案例

上次介绍当大模型做高考数学选择题：讯飞星火成AI界“掌管多选的神”？

本文由大模型领域垂直媒体「AI大模型工场」

原创出品，未经许可，请勿转载。

欢迎提供新的大模型商业化落地思路

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.