OpenAI最近推出了gpt-image-1图像生成API,开发者可以将这一先进技术轻松集成到各种应用中。这一功能自上线以来,吸引了大量用户,生成了超过7亿张图像。
OpenAI近期发布的收入预测显示,到2029年,其总收入预计将达到1250亿美元,其中AI代理业务和渠道收入将成为主要驱动力。2023年,OpenAI的收入达到37亿美元,周活跃用户超过5亿,显示出显著增长。
过去一天,国内外AI行业还有更多热点可以关注,乌鸦君带你一起看看。
大模型
1)智谱宣布旗下多款大模型产品降价,其中GLM-4-Plus降价90%
智谱BigModel开放平台于4月24日宣布其多款大模型产品价格大幅调整,进入了“亿时代”,使企业能够以低成本接触到先进的AI技术。
此次调整包括GLM-4-FlashX、GLM-Z1系列和GLM-4-Plus等多个产品,特别是GLM-4-Plus的降价幅度高达90%。这一举措旨在降低使用门槛,满足金融、互联网、教育等多个行业的需求,推动市场对大模型技术的广泛应用。
2)昆仑万维开源Skywork-R1V2.0版本
昆仑万维于4月24日发布了其多模态推理模型Skywork-R1V2.0,显著提升了视觉与文本推理能力,尤其在高考理科难题和通用任务场景中表现优异。该模型在多个权威基准测试中刷新了开源SOTA纪录,展现出与商业闭源模型相媲美的能力。
R1V2.0的开源不仅体现了昆仑万维在多模态领域的技术实力,也为全球开发者和研究者提供了强大的工具,推动了多模态生态的建设。
3)Ostris发布Flex.2-preview,8B参数扩散模型革新ComfyUI工作流
Ostris团队推出了Flex.2-preview,这是一款基于8亿参数的文本到图像扩散模型,旨在优化ComfyUI工作流。该模型在图像生成的控制能力上表现卓越,支持多种功能如图像修补和深度控制,已在Hugging Face开源,迅速吸引了AI艺术创作社区的关注。
Flex.2-preview的轻量化设计与高效推理能力,使其成为创意设计和商业应用中的理想工具,展现了未来AI艺术创作的无限可能。
4)英伟达推多模态LLM Describe Anything:指定特定区域生成详细的描述
NVIDIA AI团队推出的Describe Anything3B(DAM-3B)模型在多模态学习领域引起了广泛关注。该模型能够根据用户指定的图像或视频区域生成详细描述,超越了传统图像标注的局限性。
通过开源代码和数据集,DAM-3B为开发者提供了丰富资源,促进了多模态AI的研究与应用,尤其在教育、医疗和内容创作等领域展现出广阔的前景。
AI应用
1)OpenAI推ChatGPT新图像生成功能API:开发者可轻松集成 AI 绘图功能
OpenAI最近推出了gpt-image-1图像生成API,开发者可以将这一先进技术轻松集成到各种应用中。这一功能自上线以来,吸引了大量用户,生成了超过7亿张图像。
gpt-image-1不仅支持多种图像风格,还内置安全护栏,确保生成内容符合公司政策。此外,其合理的收费结构使得开发者能够以低成本生成高质量图像,标志着AI图像生成领域的重要进步。
2)199元!小米新款智能音箱发布:AI大模型加持,智能对话再升级
小米新款智能音箱以199元的亲民价格正式发布,虽然在硬件配置上相比Pro版有所精简,但其AI大模型的引入使得智能交互体验得到了显著提升。新音箱支持连续对话与指令语控,用户能够更高效地操控智能家居。
同时,新增的远程备车功能也为用户提供了更为便捷的出行体验。整体来看,这款音箱在性价比和智能化方面都表现出色,适合追求便捷生活的用户。
3)纳米AI发布MCP万能工具箱,简化AI工具集成与调用
纳米AI推出的MCP万能工具箱旨在简化Model Context Protocol的配置复杂性,提供一站式解决方案。该工具箱预配置了100多个MCP服务和18个常用API密钥,支持多种功能如图像、音频和视频生成。
它的发布引发了AI开发者社区的广泛关注,社区反馈积极,认为其高效性与易用性显著提升了开发者的工作效率。
4)腾讯云代码助手CodeBuddy推出Craft软件开发智能体
腾讯云于4月24日发布了全新升级的代码助手CodeBuddy,推出Craft软件开发智能体。此工具将AI编程从简单的代码补全提升至项目交付,显著提高了开发效率。
开发者只需用自然语言输入需求,Craft便能自动生成完整的项目代码,并支持主流IDE。Craft还支持MCP协议,实现代码的无缝接入测试、构建和部署,兼容腾讯生态系统,助力团队高效协作。
5)奔驰新车接入字节豆包大模型
日前,2025 梅赛德斯-奔驰品牌科技日亮相上海。而奔驰的 MMA 平台首款国产车型 —— 全新纯电长轴距 CLA 宣布接入豆包大模型。可以为车主打造个性化的智能交互体验。
据悉,本次合作也是继 2024 年 8 月梅赛德斯-奔驰与火山引擎达成战略合作后,双方合作落地的首款量产车型。全新的纯电长轴距 CLA,搭载了梅赛德斯-奔驰 MB.OS 全新自研架构,采用软硬件解耦的设计,可以为中国车主量身定制智能体验。
6)JSON Visuals for ChatGPT发布,解锁无限图像风格创作
JSON Visuals for ChatGPT的发布为图像生成带来了全新的创意维度,用户可以利用超过50种美学代码和随机化器,轻松生成个性化的视觉内容。
该工具不仅提升了生成的灵活性,还支持高分辨率输出,适用于数字艺术、品牌营销、游戏设计等多个领域。社区反馈积极,期待未来的功能优化和扩展。
投融资情报
1)OpenAI预测2029年收入激增至1250亿美元
OpenAI近期发布的收入预测显示,到2029年,其总收入预计将达到1250亿美元,其中AI代理业务和渠道收入将成为主要驱动力。2023年,OpenAI的收入达到37亿美元,周活跃用户超过5亿,显示出显著增长。
公司预计未来四年将实现现金流转正,毛利润占比将提升至近70%。这一系列预测吸引了投资者的关注,预计将推动OpenAI的快速发展。
整理/宇霁
PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.