网易首页 > 网易号 > 正文 申请入驻

Vibe Agent: Token成本直降90%,会对话就能创造专属本地Agent

0
分享至


机器之心发布

机器之心编辑部

刚刚,Local AI 领域的 Libra 团队发布了一段最新技术演示视频,展示了用户通过自然语言交互直接生成 Agent,并利用本地消费级算力支持 Agent 进行长程 (Long-Horizon) 推理,最终完成复杂任务。Libra 构建的本地化、即时响应、自我规划方案为行业开辟了一条全新的长程推理 Agent 技术路径,实现了从手工 Agent 设计向端到端 In-Context Vibe Agent 生成范式演进。

从官网信息来看,Libra 的技术方案直接回应了制约 Agent 技术普及的两大关键瓶颈:一方面,当前热门 Agent 产品如 Cursor、Devin、Manus 等虽功能强大,但运行成本高昂 —— 专业评测显示单次使用 Manus 可消耗约 1000k Token(起步 2 美元)。Libra 基于本地算力优先的架构显著降低了这一成本压力,为高 Token 消耗应用扫除障碍。另一方面,虽然主流 Agent 框架允许自定义开发,但技术门槛限制了普及范围。Libra 通过自然语言直接生成 Vibe Agent 的方式不仅简化了交互流程,更重要的是,这种端到端、无需编程的 Agent 生成范式为满足多元化、大规模的个性化 Agent 应用需求开辟了崭新道路。

让我们先看看 Libra 官网 (greenbit.ai) 发布的具体视频介绍:

场景展示:Libra 的 Agentic 规划能力

案例一:10 分钟打造即时 DeepResearch 服务

DeepResearch 作为 “模型即产品” 的 AI Agent 代表,用户想要私有化部署、接入内部数据,不仅面临昂贵的 API 调用费率,而且需要进行额外的手工编排设计。在 Libra 的 Vibe Agent 模式下,行业分析师仅需对话反馈,就能持续调教 agent,并构建专业、个性化的本地市场研究代理服务:

  • 简单描述需求:"我需要分析过去 5 年各市场电动车销量趋势,用 Python 处理数据、进行统计分析并生成可视化图表。需要按人口标准化销量数据,计算年复合增长率,并预测未来 3 年走势。"

  • Libra 智能解析需求,自动生成具备自我规划能力的行动智能体,代理用户进行网页搜索、数据清洗、时序预测、数据分析、可视化等全流程能力

  • 分析师评估代理服务的工作效果:完成了包含 15 个市场的实时市场深度分析报告,包括人均渗透率、区域增长率对比、未来预测等多维度分析,整个过程仅消耗约 80K 需要付费的云端 token,相比同等任务在云端 API 服务的调用成本降低了 90%

  • 持续调教,满意后使用 Libra 一键导出并部署到本地

案例二:一句话调教市场上的最佳 Agent 单品

除此之外,Libra 的对话式 Agent 调教模式能以极快的速度将潮流智能体产品融入用户的场景:

  • 个人 IP 孵化器:只需说 "我想根据我的每天 Mac 软件使用记录,用有趣文字连载我的《00 后职场升职记》小说",瞬间拥有专属 "数字史官",让个人品牌打造变得轻松自如。
  • Second Me:说一句 "我是一个数码产品内容创作者,模拟我的个人工作流,根据我的要求筛选每日数码科技动态,创建一个关于最新智能手机的微博话题",瞬间获得精准分析和引人入胜的微博内容。为你自主监控科技趋势,提炼核心信息,适时生成专业评测观点,让你的数码影响力持续增长。
  • 创意游戏工坊:简单一句 "需要在我的酒吧上线一个可以模拟 AI 大逃杀的对话游戏",分钟级别即可创建基于图灵测试的沉浸式大逃杀游戏体验,参与 AI 角色间的智慧博弈与尔虞我诈。

最重要的是,这些生成的 Agent 服务可以全部在本地执行,尽情使用,忘掉 Token 消耗。当然,有想法的小伙伴已经想到了, “想要专属个人助理”,“生成一个 Libra”,随着 Libra 的技术验证成功,创造力将不再是瓶颈,请开始你的对话式调教。

产品革新:Libra 对 Agent 落地的几点思考

实惠的国民 Agent: Token 总成本直降 90%

不同于普通的对话类 AI 应用,无论是 Cursor、WindSurf 等 AI Editor,还是以 Libra 为代表的 Vibe Agent 产品,都提供了复杂工具调用与多跳场景推理功能作为服务,为用户带来极致的自动化体验,而相应的推理 Token 消耗也呈现数量级的增长,当前 Agent 行业仍然处于 2G 时代的收费短信收发阶段,对有效智能的"提速降费"迫在眉睫。

根据官网信息,为了打造 Agent 服务的 "无限流量" 模式,Libra 团队通过低比特量化压缩、基于优先级的长上下文管理、端云协同等组合优化技术,实现了企业级大型语言模型在消费级桌面设备上的高效运行,从根本上改变了 AI 应用中的模型侧成本结构:

  • 端 + 云服务:采用本地模型优先的 Agent 方案,无需依赖按 Token 计费的 API 费用,消除使用量增长带来的成本压力,长期使用成本降低 90% 以上。
  • 走向消费级硬件:通过先进的模型压缩和优化技术,使消费级桌面硬件 (如 Apple M3 Ultra) 即可流畅运行企业级模型,初始投入降低 95%。
  • 初步成本预估:根据团队估算,假设用户采用最昂贵的消费级桌面硬件 Apple M3 Ultra,使用 Libra 替换纯云端 API 方案后,持续的高强度 Agent 服务月支出从 15 万元降至设备一次性投入 8 万元,初始 Apple M3 Ultra 投资可在不到 3 个月内收回成本,当我们使用更日常的消费级硬件时,成本将进一步下降。

随着开源大模型能力、消费级芯片 Memory 与计算容量的持续提升,通过 Local Token 优先的 "端 + 云" 架构进行 Agent 部署能有效摊薄用户使用成本。

拥抱 Vibe Agent: 对话模式正在拓宽需求的边界

随着对话模式深入人心,语言正在重新定义需求的边界 ——昨日的口头愿望正在转变为今天的实际需求。Libra 团队演示的 Vibe Agent 交互模式,正是对这一需求演化的精准回应。

从最新的 GPT-4o 图像直出、AI IDE 的代码辅助生成再到 Libra 的行动 Agent 生成,交互体验的突破带来的是效率的跨越式提升 —— 传统方式需要数周构建的基础 Agent,在 Vibe Agent 模式下仅需 10 分钟的对话调教,即可让 AI 自主理解场景中的工具需求与流程约束,生成同等甚至更高水平的专业级代理服务。Vibe Coding 以及 Vibe Agent 模式的出现不仅将提高人们对服务响应效率的预期,更将引领 Agent 技术领域不断向更高峰攀升。

从需求表达到服务实现的距离被大幅缩短,使得"即时满足"不再是奢望。随着这些技术的成熟与普及,我们将看到越来越多的个性化、场景化代理服务在各行各业涌现。

Local AI 的正确打开方式: Agent 即资产

Libra 团队的本地优先架构同时揭示了 Agent 时代的关键洞见:个人智能体已然成为无形但珍贵的知识资产。这一思路切中了当前 AI 发展的核心矛盾点。在知识工作者将创意、方法和解决方案输入云端 AI 工具的同时,他们也在不经意间贡献了自己最有价值的资产。

恰当的本地化策略是对这一需求的正面回应 —— 通过围绕用户需求构造本地优先的智能体,用户能够在轻松获得 AI 助力、形成个人工作流的同时,保留对自己独特工作方法的完全控制权,并实现持续迭代提升。这一转变的意义远超简单的隐私保护,它有效回应了个人与 AI 工具的关系边界。

为什么是 Libra?核心技术揭秘

从官网可知,Libra 团队持续投入本地 AI 相关核心技术栈研究,促使 Libra 成为首款在 Apple Mac 系列上直接运行的个性化 Agent 平台。摆脱云端限制,告别高昂 API 费用,让自主适应场景的 Vibe Agent 模式成为可能性:

低比特量化技术

采用基于混合精度量化和 Reasoning-Aware 低比特表征校准技术,将前沿大模型 (QwQ 32B、DeepSeek-R1-70B、Deepseek R1 671B 等) 精准压缩至符合 Apple 消费级 Silicon 硬件计算架构的 3/4 比特混合精度表征,并与 Apple MLX 机器学习推理框架无缝融合。在性能保持方面,将常规 Instruct 类大语言模型性能损失精确控制在 1% 以内,内存需求较 FP16 模式显著下降 75%+。

更令人惊喜的是,Libra 团队验证了低比特量化在提升推理模型 Thinking 阶段效率的意外优势,通过维持推理模型 Thinking 阶段在压缩前后的思考质量并压缩 Thinking 时长,模型在多种复杂推理任务上能力不降反升,相反,经典量化部署方案 (AWQ、GGUF 等) 表现出对推理模型压缩效果的不稳定性,在多项任务中出现性能、思考效率双降等问题)。这套技术栈成功突破了传统量化方法的精度瓶颈,通过精心设计的混合精度表征与重校准策略,在满足消费级硬件适配需求的同时,完美保护了影响模型核心能力的 “Super Weights”。

在 Libra 平台上 Agentic 任务对比测试结果令人振奋 —— 基于混合精度的低比特模型在复杂推理任务上的用户体验与原始模型几乎无差别。凭借这一技术路线,消费级设备如 Mac Studio 或将成为部署个性化 Agent 服务的最理想硬件平台。

自适应上下文管理引擎

为突破本地设备资源限制与模型 Context 窗口制约,同时实现有效的 Token 聚合,Libra 团队创新性地构建了事件驱动的 Token Vibe Orchestration (TVO) 策略。TVO 基于 JSX 的层级资源调度策略,对前后端和历史交互数据进行高效整合,并使用专用模型对原始 contex 进行投机总结与优先级预测,使模型能够预判用户交互意图,对最相关上下文片段进行重排,从而在有限计算资源环境下实现卓越的上下文理解能力。

测试数据表明,这种模型驱动的动态编排架构能有效提升本地 AI Agent 在长文档分析和多轮复杂对话中的记忆能力和指令跟随能力。特别是在 Browser-use 这类涵盖百万级 Token 的场景中,TVO 架构能优先保留高价值信息,显著提升模型响应质量。

响应式 Orchestration 框架

Libra 提出一种创新的 Meta Agent-Orchestration (MAO) 框架,为 Vibe Agents 生成进行 Instance Multi-Agents Orchestration 与资源调度。MAO 框架针对 Orchestration 场景定制了专用策略智能体,内化了复杂的 Orchestration 相关知识,使系统能够自主推理、预测最佳协作路径。基于高效的数据库策略,MAO 能够对大量外部工具链、前后端即时交互 Context 进行系统化整合。这种设计确保各组件间无缝协作,即使在本地设备资源受限的情况下也能保持高效运行。作为框架的重要补充,MAO 还针对数据流通层可用性构造了专用预测器,通过实时图联通性验证,实现了自然语言生成 Agents 的可用性验证,有效降低了任务失败风险。

可以预见,Libra 基于消费级硬件与端到端 Agent 生成的技术方案将加速 Agent 对个人与小微团体办公场景的加持:

1. 桌面级 AI 赋能:企业可直接在 Mac Studio 等消费级设备使用 Libra 运行高性能的 Vibe Agent 服务,为组织提供便捷的 AI 能力获取路径,使 AI 技术与日常办公环境无缝融合。

2. 创新周期加速:产品经理与 AI 玩具开发者等能在熟悉的 Mac 工作站环境中基于 Libra 完成 Agent 原型设计并使用 Libra Engine 导出部署,专注于应用场景创新,快速将 AI 概念转化为实用解决方案。

3. 灵活部署选择:通过 Mac Studio 等消费级硬件实现本地化 AI 能力,为企业提供多元化的部署选项,使各类组织能根据自身需求和 IT 策略灵活采用 AI 技术。

结语

Libra 提出的 Vibe Agent 范式代表了 Agent 技术演进的新方向。这一范式通过对话式交互构建智能体的方法解决了传统 Agent 开发中的技术壁垒问题,将繁复的工程化流程简化为自然语言指令。Vibe Agent 的关键技术价值在于实现了从预定义框架到端到端生成的转变,使非技术背景用户也能根据具体场景需求实现 In-Context 的 Agent 定制。这种范式转换不仅是交互层面的优化,更是对 Agent 开发模式的重构。

在技术实现层面,Libra 通过本地模型优先的架构策略,配合低比特量化和优先级上下文管理,使 Token 成本大幅度下降。这一成本优势使得持续性、高频率的 Agent 交互在经济上变得可行。通过端云协同机制,企业级模型能力被有效压缩并部署至消费级硬件平台,为用户提供接近无限制的生产力体验。从产业发展角度分析,Vibe Agent 范式的价值体现在两个维度:首先,显著降低的计算成本将重塑 Agent 的经济模型,使 AI 能力从企业级资源转变为个人级工具;其次,对话式创建机制将实现 Agent 开发应用的普及,促使专业知识从封闭系统向开放生态转变。Libra 的技术方案为 Agent 技术走向普惠化提供了可验证的实施路径,预计将在近期推动 Agent 应用从概念验证阶段迈向规模化部署阶段。随着端侧计算资源进一步优化,Vibe Agent 模式有望成为下一代 Agentic 产品开发的标准范式。

  • Libra 官方网站:greenbit.ai
  • 申请试用:info@greenbit.ai

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
演员金莎发声称节目录制起针眼:眼睛疼无法化妆;丈夫孙丞潇为其拍摄氛围照

演员金莎发声称节目录制起针眼:眼睛疼无法化妆;丈夫孙丞潇为其拍摄氛围照

TVB的四小花
2026-05-16 17:47:19
一定要多存钱,大量存钱,特别是2026-2028年。

一定要多存钱,大量存钱,特别是2026-2028年。

老陆不老
2026-05-10 15:37:02
海豹突击队的2分钟入睡法,失眠的人该试试了

海豹突击队的2分钟入睡法,失眠的人该试试了

晚风也遗憾
2026-05-14 07:48:01
2025款雷克萨斯ES,上市指导价29.99万,目前新车优惠10.3万

2025款雷克萨斯ES,上市指导价29.99万,目前新车优惠10.3万

隔壁说车老王
2026-05-16 07:49:48
铁证面前,还能撤案?深扒无果、信息全封,路虎车主背景有多硬?

铁证面前,还能撤案?深扒无果、信息全封,路虎车主背景有多硬?

世界圈
2026-03-24 12:52:50
90岁钟南山公开6个长寿秘诀:第一条就很多人做不到,看完就明白

90岁钟南山公开6个长寿秘诀:第一条就很多人做不到,看完就明白

医学科普汇
2026-05-14 17:41:18
美媒看好雷霆淘汰马刺!晒出三大理由:最有办法限制文班的球队?

美媒看好雷霆淘汰马刺!晒出三大理由:最有办法限制文班的球队?

罗说NBA
2026-05-16 22:16:13
泰勒·斯威夫特牵手男友浪漫约会,婚礼传闻再起

泰勒·斯威夫特牵手男友浪漫约会,婚礼传闻再起

追星雷达站
2026-05-17 00:19:14
他是外交部原部长,1985年被邓小平怒批“胡说八道”,活到了98岁

他是外交部原部长,1985年被邓小平怒批“胡说八道”,活到了98岁

历史人文2
2026-05-09 22:00:03
中雨、大雨即将抵达长春

中雨、大雨即将抵达长春

吉刻新闻
2026-05-16 16:17:00
马尔代夫发生史上最严重单次潜水事故:5名游客身亡,包括海洋生物学家、前潜水教练等;遗体在约50米深水下洞穴被发现,疑因“氧气中毒”

马尔代夫发生史上最严重单次潜水事故:5名游客身亡,包括海洋生物学家、前潜水教练等;遗体在约50米深水下洞穴被发现,疑因“氧气中毒”

鲁中晨报
2026-05-16 09:30:04
必须奖励!深圳小伙觉得飞机不太对劲拍照反馈,排查发现真有故障

必须奖励!深圳小伙觉得飞机不太对劲拍照反馈,排查发现真有故障

观世记
2026-05-16 15:06:12
特朗普说漏嘴:库克马斯克黄仁勋来中国,自己排队来的,没邀请

特朗普说漏嘴:库克马斯克黄仁勋来中国,自己排队来的,没邀请

说历史的老牢
2026-05-16 21:11:10
普通家庭最大的通病,是把托举的顺序搞反了

普通家庭最大的通病,是把托举的顺序搞反了

洞见
2026-05-15 10:08:02
情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

新欧洲
2026-04-21 19:37:05
明朝灭亡前24小时,崇祯手里还有一张王牌,为何宁死不用?

明朝灭亡前24小时,崇祯手里还有一张王牌,为何宁死不用?

勇哥读史
2026-05-15 21:02:05
《歌手2026》宣布首发阵容:齐豫、庾澄庆 、魏如萱 、胡彦斌 、张碧晨 、斯纳吉 、尤长靖 、周兴哲、窦靖童

《歌手2026》宣布首发阵容:齐豫、庾澄庆 、魏如萱 、胡彦斌 、张碧晨 、斯纳吉 、尤长靖 、周兴哲、窦靖童

鲁中晨报
2026-05-16 14:30:07
怪不得这么多男明星和她传过绯闻,现实中确实惊为天人

怪不得这么多男明星和她传过绯闻,现实中确实惊为天人

老吴教育课堂
2026-05-16 19:34:39
“摸奶子”再惹争议,OPPO的流量反噬开始了

“摸奶子”再惹争议,OPPO的流量反噬开始了

品牌头版
2026-05-13 10:18:15
美国情报部门承认:伊朗90%导弹设施已恢复,居然是朝鲜帮了忙?

美国情报部门承认:伊朗90%导弹设施已恢复,居然是朝鲜帮了忙?

赤影战士
2026-05-14 07:40:19
2026-05-17 02:36:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13007文章数 142650关注度
往期回顾 全部

科技要闻

涨的是车价,要的是老命

头条要闻

又想“抹黑”中国 福克斯新闻“翻车”了

头条要闻

又想“抹黑”中国 福克斯新闻“翻车”了

体育要闻

马刺2号,少年老成,这集看过?

娱乐要闻

谢霆锋北京街头骑行被偶遇,侧颜帅炸

财经要闻

造词狂魔贾跃亭

汽车要闻

大五座SUV卷王!乐道L80上市 租电15.68万元起

态度原创

艺术
家居
房产
游戏
健康

艺术要闻

惊!艾米·亚当斯竟是坠入凡间的仙女?

家居要闻

110㎡淡而有致的生活表达

房产要闻

老黄埔热销之下,珠江春,为何去化仅3成?

曝索尼大量神作真有计划复活!PS日系经典IP已在路上

专家揭秘干细胞回输的安全风险

无障碍浏览 进入关怀版