网易首页 > 网易号 > 正文 申请入驻

全民裁判AI模型实力,字节扣子启动匿名竞技场

0
分享至



作者|清川

编辑|方奇

媒体|AI大模型工场

苹果和OpenAI的联手让我们看到了一个新的AI定义“Apple Intelligence”,让AI更懂你。

但是这种只停留在了表面,缺少了实际的应用,更没有看到杀手级应用的出现。

高昂的训练成本和技术难度一直是制约AI应用的两大难题。长期以来,AI被视为仅限于大型企业和科研机构的高端领域,它的实际应用则多囿于搜索引擎优化和图像编辑等狭窄范畴。

前段时间,大模型降价潮来袭,各家模型价格卷到飞起。实际上,这轮公有大模型降价很大程度是为了吸引开发者,让更多的开发者参与到应用的开发中,但普通人离大模型应用还很远。

但总的来说,大模型要作为商业产品,不仅要让大家易上手,更要降低开发成本和时间成本。

在2024大模型应用场景之年,大家都在期待着“杀手级应用”的出现。就是在这样的背景下,一些新兴平台,如扣子,正试图通过提供更易用的AI搭建工具,降低技术门槛,让AI技术的应用变得简单,好上手。

让开发者能够如同抖音创作者一样,百花齐放,最后形成一个大模型应用的生态。

而在模型广场,用户可以直接让不同大模型进行PK对决,让普通人真正感受到大模型应用的魅力。

那么像字节扣子模型广场,是如何做到让人人都会做大模型应用的,在未来扣子又能做成怎样的大模型应用生态?

人人都是大模型应用开发者

门槛低和能力强才是关键


在低代码的发展中,流行着一句话:人人都是低代码开发者。这一理念已经成功跨越多个行业,有效解决了不同场景下的挑战。

那么,对于大模型而言,是否存在一个人人都可搭建的平台,生长出不同有用又有趣的应用?

而扣子,恰恰就是这样一个平台,专注于连接大模型和用户场景,服务于新一代的AI应用开发。

扣子平台的魅力在于其低门槛的开放性。无论你是否具备编程基础,你都能够在这里快速搭建出基于大模型的各类Bot,并轻松将其发布到各大社交平台、通讯软件,或部署到网站等多元渠道。

这种低门槛的开放方式,让AI离应用更近了一步,而能力强也是大模型应用的一个关键。新时代的开发者,范围将因此扩大很多。

在home bot主界面,只需简单输入“我想做一个找资料 的Bot”,即可轻松创建一个专属于自己的资料搜索专家。


招商银行用来分析市场bua行情的“财富看点”Bot,猎聘的“找工作助手”Bot,复旦大学的《生态学》课程的辅导助手。浙江大学的物理实验助教“小理”,各行各业都在选择使用扣子创建AI Bot。

显而易见,扣子平台提供了易于使用的工具和环境,使用户能够借助大语言模型的强大能力,快速构建和部署各种AI应用。

理想中的AI Bot,通过模拟人类对话和提供智能服务,能逐渐成为各行业提升效率、改善用户体验的重要工具。

法小理Bot能为你提供一份详细的离婚协议模板,5分钟阅读Bot能介绍每首诗歌或散文的创作背景及其背后的故事,简单输入“职场复仇”的题材和风格,就能生成一本完整的精品爽文小说。

目前,扣子平台的Bot商店里,已汇聚了各式各样的AI Bot。从个人爱好者到企业用户,从休闲娱乐到办公助手,从专业技术开发者到小朋友,即使没有编程基础,也可以在扣子上创建和使用基于大模型的Bot。

在今年5月的火山引擎发布会上,扣子产品经理潘宇扬曾分享这样一个案例:一位五年级的小朋友,仅用学校中学到的语文知识,就在扣子平台上创建了自己的英语外教AI Bot。

在快递行业里,都在发愁,谁能真正解决最后一公里的问题,而在目前大模型发展中,谁能解决大模型的“应用一分钟”,这或许才是大模型的真正意义,模型再大,用户用不上一分钟,也等于没用。扣子可能会让大家看到更多真实场景,让应用成为主流。

多家大模型一键battle

模型广场直接检验应用能力

尽管Bot商店的一些AI Bot功能尚待完善,扣子却一直努力走在AI开发者生态前头。全民玩AI的时代已经来了,大模型已经足够多了,那么谁才是更好用地那一个?

要如何高效地使用大模型,扣子的模型广场给出了答案,而要更简单地上手对比体验。

目前扣子已经接入了多个国内知名大语言模型,包括豆包、通义千问、GLM-4、MiniMax、Moonshot、Baichuan4,用户可以在创建Bot时一键切换不同模型。

实际上,当前并没有一个全面万能的大模型。每个大模型都有其独特的优势和专长,也因此众多业内人士预测MOE模型或将很长一段时间成为未来大模型发展的主流趋势。

Bot开发不只是技术实现的问题,它还涉及商业策略、用户体验设计、成本控制等多个关键方面。选择合适的模型是确保Bot开发成功的关键因素之一。

为此,扣子平台提供了模型广场这样一个在线大模型对比与评估系统,帮助开发者选择最合适的大模型。

具体而言,来到扣子模型广场,开发者可以根据项目需求(比如行业特性、功能需求、性能要求等),选择最适合的AI模型。


除了提供专业客观的技术支持,扣子平台的对战模式还为开发者提供了一个直观的工具,用以比较不同模型的性能和特点。

进一步理解对战模式,也就是扣子模型广场的对战功能,允许开发者在特定场景下测试不同模型的表现。

想象你要为你的宠物店开发一个智能助手Bot,来帮助顾客解答关于宠物护理的问题。

那么打开扣子的官网(coze.cn),点击左侧的导航栏“探索”列表中“模型广场”,便可开始体验了。


在这里,你会发现三种不同的对战模式。分别是随机开始,纯模型对战,以及选一个Bot进行对战。


假设,你选择了指定Bot对战,并且已经选定一个叫“喵星人”的Bot


为了测试“喵星人”在猫知识方面的专业性,扣子将安排“喵星人”与随机的AI模型进行对战。


在这场对决中,各个Bot会基于Promt、工作流、知识库等能力,回答同一个问题,比如:“猫咪一天需要遛几次?

显然,在这个案例中,大模型B表现得更好。


当你完成投票后,大型模型的真实身份也将揭晓,分别是GLM-4(A)和MiniMax6.5s(B)。


指定Bot对战,用来评估特定Bot在专业领域的表现;相对而言,随机Bot对战,侧重评估模型在随机场景的通用能力;而纯模型对战则专注于评估模型自身的基础文本生成能力。

但无论如何,通过这些对战测试,你可以深入了解不同AI模型在实际应用中的性能和适用性,进而做出更合理的技术选型和应用开发决策,不断优化和升级你的宠物店Bot。



全民受用的AI应用

究竟会是什么样的?

当你踏入扣子的“Bot商店”,就会发现这里的Bot们并非单调乏味的存在,它们与时代文化同步,随着热点趋势不断演变,展现了不一样的创新氛围。


创造优化Bot的过程是复杂各异的,但所有这些努力都是为了一个共同的目标:提升用户体验。

除了通过上线模型广场吸引不同背景的用户来构建Bot,并通过匿名测试评选更适合Bot大模型之外,扣子还做出了一系列努力来提升用户体验。

为了拓展 Bot 的各种技能,扣子提供了插件、工作流、图像流、触发器;而为了让Bot更加个性化,扣子提供了长期记忆、数据库和文件盒子等工具,让Bot能够记住用户的喜好和重要信息。


还是引用扣子产品经理潘宇扬的理解:无论是旅行中发现的美味葡萄酒,还是日常中的点滴想法,Bot都能一一捕捉,并为用户提供贴心推荐。

从早晨的天气查询、通勤规划,到工作时的邮件分析,再到下班后的娱乐推荐和轻松对话,Bot都能成为你生活中的得力助手和忠实伙伴。

AI Bot已经在各行各业展现了独特价值,不过技术的演进从来都是一个持续的过程。事实上,由于技术难度和市场情况不同,AI应用不同领域的竞争格局已经出现了明显的区别。

在技术门槛较低、模型发展成熟的领域,如文字和图片生成,模型间的差异逐渐缩小。未来,关键在于如何深入挖掘特定使用场景,提供定制化的解决方案,以更好地满足用户需求。

Data.ai的数据显示,2023年12月AI相关应用的下载量达到9300万次,全年移动端下载总量达到8.1亿次,同比增长652%。这一显著的增长不仅反映了市场对AI技术的高度认可,也突显了AI技术的广泛应用潜力。

实际上,从宏观层面看,大模型的应用的爆发点也就是AI普惠点。就像微信、抖音这些全民级APP是在4G普及和安卓千元机普及后出现的,AI也将在扣子这类AI开发平台的加持下迎来一个全民可开发、可使用的时代。

更重要的是,AI的未来更将是一个不断自我完善、不断情感和认知层面与人类建立更深层次联系的过程。这不仅是技术的革新,更是人类生活方式的一次深刻变革。

回到最后的问题,全民受用的AI工具将不只是执行命令的机器,而应成为具备高度自适应性、预测性和个性化服务能力的智能体,深入理解并满足人类需求。

至少,在目前的大模型应用里,扣子正在走自己独特的一条道路,更简单,更开放,更好用。

在生态建设的语境下,扣子模型广场为使用者提供了一种低门槛、低成本的模型竞争与比较机制。当用户在面对众多大模型选择而犹豫不决时,这种机制为他们提供了更为明晰的选择。

只有当这些应用足够多,跑出来的数据足够好用,并且这些应用间能形成协同效应,共同解决问题时,整个应用生态才会焕发出更为蓬勃的生命力,从而孕育出杀手级的创新应用。就像抖音的创作者一样,大家都在追求内容的极致,才能产生更好的内容,才能做好协同。

写在最后:扣子联合Intel 推出了“扣子AI工坊”(Coze AI Factory)活动,这是扣子与英特尔共同推出的一场主题Bot征集盛会。活动专注于图文创作、实用工具、互动创意这三个赛道,有想法、感兴趣的读者可以参加。


AIGC大模型工场已经组织了非常精准的「AI大模型垂直社群」,覆盖超1000位AIGC圈,百度大模型业务负责人,京东大模型业务负责人,腾讯大模型业务人,阿里云大模型技术负责人,科大讯飞大模型公关,商汤大模型业务,阅文大模型公关,360大模型公关负责人都在群里啦,欢迎大模型业务负责人加入。请加微信fqq2000nian ,注明真实身份。

数据支持天眼查,大模型独家合作账号

监制 / 刘老师

编辑 / AIGCCCCC

视觉 / 大模型

微博 / @AI大模型工场

TG/AI Marketing Field


大模型应用创业者,你怎么看?

■ 百度文心一言,阿里通义千问 ▍通用大模型案例

■ 科大讯飞星火 京东 ▍产业大模型案例

■ 商汤日日新、腾讯,昆仑万维 ▍ 金融大模型案例

■ 盘古大模型,中国电信,医联 ▍医疗大模型案例

■阅文大模型,腾讯音乐大模型 ▍ 文娱大模型案例

■知乎,360大模型,火山引擎 ▍ 教育大模型案例

■ 网易,金山办公大模型 ▍ 更多行业大模型案例

上次介绍当大模型做高考数学选择题:讯飞星火成AI界“掌管多选的神”?


本文由大模型领域垂直媒体「AI大模型工场」

原创出品,未经许可,请勿转载。

欢迎提供新的大模型商业化落地思路

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
湖北一男子带岳母抓妻子出轨,看到床上的人,岳母直呼:怎么是你

湖北一男子带岳母抓妻子出轨,看到床上的人,岳母直呼:怎么是你

五元讲堂
2024-10-31 12:02:58
9胜2负积20分!新疆登顶CBA榜首,北京9胜1负暂居第二

9胜2负积20分!新疆登顶CBA榜首,北京9胜1负暂居第二

雷速体育
2024-11-27 22:07:10
轰20+10+5夺冠!中国男篮又一18岁新星崛起:助攻第2抢断第1真猛

轰20+10+5夺冠!中国男篮又一18岁新星崛起:助攻第2抢断第1真猛

李喜林篮球绝杀
2024-11-27 16:54:27
外媒:菲律宾警方称对菲副总统等人提起诉讼,杜特尔特办公室回应

外媒:菲律宾警方称对菲副总统等人提起诉讼,杜特尔特办公室回应

环球网资讯
2024-11-27 15:13:09
一刀未剪的A级大片,还是扑惨了

一刀未剪的A级大片,还是扑惨了

独立鱼
2024-11-27 22:04:19
2017年,陈明与后妻合葬,骨灰盒中却放回忆录《我与丁玲五十年》

2017年,陈明与后妻合葬,骨灰盒中却放回忆录《我与丁玲五十年》

奇葩历史观
2024-11-26 09:01:26
在设计院,性能力才是第一生产力

在设计院,性能力才是第一生产力

黯泉
2024-11-21 19:48:40
央视报道!事发济宁!!情况危急!!!

央视报道!事发济宁!!情况危急!!!

JN生活君
2024-11-27 21:38:09
小米 “ 副业 ” ,怎么成了顶流?

小米 “ 副业 ” ,怎么成了顶流?

科技狐
2024-11-27 09:54:26
“人人喊打”,“今日头条们”如何成了过街老鼠?

“人人喊打”,“今日头条们”如何成了过街老鼠?

天天财经116
2024-11-26 16:29:48
鼓励自费看病?2025年将实行医保新规,具体条例你看懂了吗?

鼓励自费看病?2025年将实行医保新规,具体条例你看懂了吗?

博览历史
2024-11-27 21:35:33
37岁李易峰转战日本,穿牛仔衣重回颜值巅峰,和网友合照神采奕奕

37岁李易峰转战日本,穿牛仔衣重回颜值巅峰,和网友合照神采奕奕

南城无双
2024-11-26 00:15:56
38岁何洁暴瘦70斤!穿亮片短裙大秀细腰美腿,美到差点认不出

38岁何洁暴瘦70斤!穿亮片短裙大秀细腰美腿,美到差点认不出

南城无双
2024-11-27 12:38:10
湖南一老人因嫖娼死亡?细节曝光,社区有回应 网友:祭文如何写

湖南一老人因嫖娼死亡?细节曝光,社区有回应 网友:祭文如何写

鋭娱之乐
2024-11-27 20:59:25
SpaceX 获准继续发射星舰,环保组织诉讼被驳回

SpaceX 获准继续发射星舰,环保组织诉讼被驳回

IT之家
2024-11-27 15:09:21
网传某知名寺庙的住持带领僧人申请美国签证,仅四五位弟子过关,四十多人被拒

网传某知名寺庙的住持带领僧人申请美国签证,仅四五位弟子过关,四十多人被拒

六子吃凉粉
2024-11-26 21:50:07
广州一警花嫁给“副局长”,同床5年后,意外发现丈夫真实身份

广州一警花嫁给“副局长”,同床5年后,意外发现丈夫真实身份

兰姐说故事
2024-11-10 05:00:03
保罗乔治曾经公开宣扬10个言论,但是都已经食言了

保罗乔治曾经公开宣扬10个言论,但是都已经食言了

好火子
2024-11-28 04:58:10
国产伟哥一片1块多,进口伟哥贵二十倍效果更好?真相来了!

国产伟哥一片1块多,进口伟哥贵二十倍效果更好?真相来了!

李药师谈健康
2024-11-27 17:41:24
再等9天就上市!车长近4米8,“颜兽”气质218马力,预售价公布迷倒一片!

再等9天就上市!车长近4米8,“颜兽”气质218马力,预售价公布迷倒一片!

沙雕小琳琳
2024-11-27 20:10:23
2024-11-28 06:48:49
AI大模型工场
AI大模型工场
专注AI大模型行业媒体,深度解读公司大模型行业动态,且提供一手的AIGC,行业大模型内容。
158文章数 23关注度
往期回顾 全部

科技要闻

利润暴跌40%后,三星芯片部门任命新负责人

头条要闻

特朗普宣布俄乌冲突问题特使人选 曾任白宫要职

头条要闻

特朗普宣布俄乌冲突问题特使人选 曾任白宫要职

体育要闻

网红主播踢顶级联赛 这是什么奇葩俱乐部

娱乐要闻

天呐鹿晗瘦了这么多,像漫画出来的

财经要闻

马光远:所有的房地产政策基本都到位了

汽车要闻

中国的超豪华车尊界S800 预售百万起/ L3级智驾

态度原创

数码
健康
手机
公开课
军事航空

数码要闻

DJI大疆发布迷你无线麦克风DJI Mic Mini:299元起售

花18万治疗阿尔茨海默病,值不值?

手机要闻

3699元起!这顶配性能旗舰,要把友商锤爆了?

公开课

一块玻璃,如何改变人类世界?

军事要闻

黎以停火协议生效 以军警告

无障碍浏览 进入关怀版