字节跳动发布豆包，AI大模型进入应用“深水区”？|翻译|ai|视频生成模型

字节跳动发布豆包，AI大模型进入应用“深水区”？

2024-05-16 15:18:01　来源: 科技说说

北京举报

分享至

文/科技说说

AI大模型领域，正在被扔下一颗又一颗“重磅炸弹”。

就在5月14日凌晨，OpenAI正式推出新一代生成式AI模型——GPT-4o，且聚焦于应用层面。GPT-4o旨在充当手机或平板电脑上的个人助理，具有改进的语音交互功能，拥有更强大的语言翻译能力，以及更快的响应时间。

一天之后，谷歌也迅速反击——在新一届I/O开发者大会上选择“宣布一切”：连续发布、更新了十多款产品，包括AI助手Astra、文生图模型Imagen3、对标Sora的文生视频模型Veo，以及备受瞩目的旗舰大模型Gemini。

而国内科技巨头也不甘落后。5月15日，在火山引擎原动力大会上，字节跳动正式发布豆包大模型家族。豆包大模型以超低价格亮相，并展现了自身对字节跳动的意义，以及在应用层面的诸多可能性。而从整个AI大模型领域看，国内外都在加速进入应用“深水区”。

豆包以低价策略露出“獠牙”

事实上，很多人对豆包都非常熟悉。早在去年6月，豆包APP身为一款AI对话助手就已经在苹果APP Store和各大安卓应用市场上线。

从豆包APP这一实用工具看，包括“写作神器、超爱聊天的小宁、AI智能体生成器、AI图片生成、学习小帮手、AI漫画生成、英语学习助手、MUSE音乐电台”等功能，可以说在一定程度上满足了人们的使用和陪伴需求。甚至对不少打工人而言，豆包APP凭借信息检索的高效和全面，出色的创作和总结能力，成为必备的“工作神器”。

强大的功能再加上有字节跳动的背书做加持，让豆包APP在与众多竞争对手的对决中有着不错的亮眼表现。从发布会上公布的数据显示，截至目前，字节跳动旗下大模型应用豆包APP总下载量已经突破1亿，双端月活跃用户突破2600万，智能体创建总数800万。此外，据了解，豆包APP的下载量在AIGC类应用中排名第一。

更重要的是，豆包APP是字节跳动重点投入的大模型应用之一，表现出色的“打头阵”先锋效果，让字节跳动坚定了通过AI大模型来革新自家业务的决心。除了豆包APP这一AI对话助手外，字节跳动还基于AI大模型推出了AI应用开发平台“扣子”、互动娱乐应用“猫箱”，以及星绘、即梦等AI创作工具，并把大模型接入抖音、番茄小说、飞书、巨量引擎等50余个业务，用以提升效率和优化产品体验。

可以说，时至今日在字节跳动自家的“试验田”中，已经结出了累累硕果，也证明了自家大模型的成熟度。据悉，经过一年时间的迭代和市场验证，豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一，目前日均处理1200亿Tokens文本，生成3000万张图片。

而从类型看，豆包大模型包括通用模型Pro/lite、角色扮演模型、语音识别模型、语音合成模型、声音复刻模型、文生图模型、Function call模型、向量化模型等多个类型。这也意味着，豆包大模型能够应用在多个细分领域。

在这样的背景下，对外开放已成为必然。因此，我们看到此次字节跳动发布豆包大模型实际上是在露出“獠牙”，想要以更为核心的竞争力来参与到市场竞争中。而除了实用性之外，豆包大模型的杀手锏是以低价策略带动大模型价格进入“厘时代”。

具体来看，豆包通用模型pro（32k）价格为0.0008元/千tokens，豆包通用模型pro（128k）价格为0.005元/千tokens。和32k及以下模型的业内价格相比，GPT4（32k）为0.42元/千tokens，百度文心一言ERNIE 4.0（8k）为0.12元/千tokens，阿里通义千问Qwen 2.5-max（30k）0.12元/千tokens，豆包比行业价格低99.3%；和128k模型的业内价格相比，GPT4-Turbo（128k）价格为0.07元/千tokens，豆包比行业价格低95.8%。

可以看到，豆包大模型的价格相比对手是较为便宜的。我们能够预见，百度、阿里等旗下的大模型极有可能会在价格方面迅速跟进。一场发生于大模型领域的“价格战”，即将打响。而这无论是对于企业用户，还是广大普通消费者来说，都将是非常有益处的。这也在表明，大模型在迈入一个新的维度，将要全面开启应用层面的新浪潮。

AI大模型进入应用“深水区”

在数字化时代的浪潮中，大模型正成为推动创新和变革的引擎。AI技术的进步，大模型应用的爆发，已成为近两年科技行业的普遍现象。这不仅是技术的飞跃，更是对智能思维和数据处理能力的革命性突破，更在深度影响着千行百业对大模型的实际应用。

大模型的落地、应用，如同马车到蒸汽机、内燃机的深度蜕变进程。科技进步带来生产效率的提升，成为滚滚向前的时代浪潮。在这股不可逆的浪潮中，马车被逐渐淘汰，而汽车行业却欣欣向荣——大模型的应用也在迎来属于自身的时代。

在OpenAI、谷歌、微软、英伟达等海外科技巨头，以及百度、阿里、华为、字节跳动等国内科技巨无霸，以及万千初创企业等共同努力下，大模型的应用在真正进入“深水区”，带来颠覆式影响。

比如，对于个人而言，从文本创作到日常办公，大模型正以更加精准和高效的服务方式赋能各种场景。对于企业级应用而言，在营销、客服、研发等业务领域，大模型正在发挥无可估量的作用，加速着行业的数字化转型和智能化升级。

就目前看，基于大型的能力特性，数字化水平较高、数据基础较完善、知识体系较复杂的行业和场景往往最先落地大模型技术并发挥出应用价值。而以实际应用为突破口，更能让业界和大众通过创造、体验更为具体的落地实现方式，展现大模型在降本提效、业务创新和体验增强等多个维度的价值。

根据沙丘社区发布的《2024中国大模型先锋案例TOP30》指出，经过1年多以来对大模型技术落地应用的跟踪，截至2024年1月中旬，大模型落地应用案例中金融(35%)行业占比最大，其次为制造(13%)、医疗(10%)、政府与公共服务(8%)。从应用场景上看，知识管理(22%)、数据分析(13%)、内容创造(12%)、对话交互(9%)等场景天然与大模型技术结合紧密，也是当前企业主要探索的方向。

比如，在股票投资服务场景中，股民当所关注的个股出现较大幅涨跌时，总希望了解背后的原因来辅助决策。腾讯自选股就针对这个需求，每日挑选重点个股，进行涨跌原因解读和稿件推送。之前采用人工编辑的方式，问题在于每日稿件生产量不足 10 篇，尤其高质量稿件生产耗时长。

而利用金融大模型，能够有效实现效率和质量的双提升，稿件生产快、覆盖个股全，同时质量还能达到人工编辑的优秀程度，编辑仅需对最终输出进行复核保障安全合规要求。在个股行情触发涨跌幅时，可在5分钟内生成稿件，效率提升5倍以上。

此外，勃林格殷格翰面向医药代表提供Chatbot智能问答服务，可以询问医学和平台类的问题。在此基础之上，基于大模型和知识图谱的能力，可快速提升医学内容生产自动化，解决医学问询过程中的时效性、合规性问题，并提高学术推广效率。

而网易伏羲基于雷火游戏积累多年的美术资产，针对不同游戏项目风格自研了多款游戏美术大模型，同时搭建了可在线使用的A1生图平台，融入到美术资产生产的工作管线中，为游戏美术带来了一套新的生产方式，让总体生产大幅提效。

类似的大模型在实际应用中扮演重要角色的案例，层出不穷。而循着探索的方向能够发现，应用是大模型的“磨刀石”。大模型赋能下的高质量应用，则具备专业化、低成本、高可靠解决行业痛点问题的能力。

从文生文、文生图到文生视频，乃至更加丰富的功能，大模型在通过海量应用不断解锁新能力，充分呈现出未来可期的一面。从更长远的趋势看，大模型在应用层面的加速落地，则将加速形成新质生产力，推动数字经济的提质换档。

2024年政府工作报告明确提出，要“深化大数据、AI等研发应用，开展'AI+’行动，打造具有国际竞争力的数字产业集群”。相信在“AI+”战略的推动下，千行百业能够借力大模型催生大量产品形态、生产力、生产方式、产业组织等多层面的创新，实现更高质量的发展。

我们相信，技术的真正价值并非仅仅停留在理论中，而是需要通过实际的应用场景来发挥。大模型是效率、体验和创造力的倍增器，也在千行百业的实际应用中有着广阔前景。大模型能支撑各行业应用创新，实现智能化转型升级，提高生产效率，激发创新活力，重塑产业生态，培育经济发展新动能。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.