OpenAI在技术直播中推出了其最新的多模态模型o4-mini和满血版o3,这两款模型具备同时处理文本、图像和音频的能力,并能调用外部工具进行复杂任务的处理。
腾讯推出的“元宝”是首个在微信平台上运行的AI助手,用户可以直接在微信中搜索并添加为好友,享受更真实的聊天体验。
过去一天,国内外AI行业还有更多热点可以关注,乌鸦君带你一起看看。
大模型
1). OpenAI推出最强推理模型o3和o4-mini,支持“图像思考”与多模态推理
OpenAI推出了最新的满血版o3和o4-mini模型,是目前最智能的版本,具备全面的工具访问能力。o3是功能最强大的推理模型,擅长多领域任务,如编程、数学、科学和视觉感知等,在视觉任务上表现出色,能分析图像、图表等,在复杂查询中提供精准答案。o4-mini以快速、高效的推理能力著称,适合高吞吐量任务。
2). 字节发布豆包1.5深度思考模型:多模态深度思考、延迟低
在4月17日的火山引擎AI创新巡展杭州站上,字节跳动发布了豆包1.5深度思考模型,展示了其在数学、编程、科学推理及创意写作等领域的卓越能力。该模型采用MoE架构,参数配置优越,推理成本低。结合视觉理解技术,模型能够分析照片、辅助旅行和项目管理,并且视频搜索能力显著增强,提升了用户获取信息的便利性。
3). 豆包深度思考和文生图3.0模型正式开放API对企业客户开放
豆包大模型近期发布了豆包1.5·深度思考模型和豆包文生图模型3.0,正式通过火山引擎开放API,供开发者和企业客户使用。这两款模型在推理和图像生成任务上表现卓越,推动了AI技术的应用与发展。深度思考模型在专业推理任务中表现突出,而文生图模型则在图像生成质量上有显著提升。
4). 月之暗面Kimi开源数学定理证明模型Kimina-Prover
Kimi技术团队发布了Kimina-Prover的预览版,开源了多个模型和数据集,展现出在形式化定理证明领域的出色性能。Kimina-Prover通过结合大规模强化学习与形式化推理,显著提升了模型的推理能力和样本效率,达到了80.7%的通过率,超越了以往最佳结果。
5). 再创开源多模态大模型性能标杆,书生·万象3.0升级发布,创新预训练方法
上海人工智能实验室开源升级了通用多模态大模型书生·万象3.0(InternVL3)。模型采用创新的多模态预训练方法,将语言和多模态学习整合于同一预训练阶段,显著提升了多模态基础能力。在10亿至780亿参数的全量级版本中,InternVL3在开源模型性能上位列第一,接近闭源模型Gemini-2.5-Pro。
AI应用
1). 微信首个AI助手“元宝”正式上线,可以添加为微信好友
腾讯推出的“元宝”是首个在微信平台上运行的AI助手,用户可以直接在微信中搜索并添加为好友,享受更真实的聊天体验。元宝不仅能解析微信公众号文章、图片和文档,还能进行智能互动,回答用户的进一步提问。该助手关注用户隐私,具备证件照自动打码功能,虽然目前不支持语音或视频通话。
2). OpenAI开源超Agent:CodexCLI,五小时内破5000颗星
OpenAI最近发布了CodexCLI,这是一款轻量级的代码智能体工具,发布后迅速获得了极大的关注,仅在五小时内便突破了5000颗星的评价,预计当天将突破1万颗星。CodexCLI具备自动生成、运行代码、重构和测试等强大功能,极大地提升了开发者的工作效率。
3). JetBrains推出编码智能体JunieAI,助力编程与调试体验
JetBrains最近宣布其新编码智能体JunieAI已达生产就绪状态,旨在帮助开发者更高效地进行代码编写与调试。JunieAI的推出标志着JetBrains在AI工具领域的重大进展。此外,JetBrains还更新了其旧版AI助手,支持最新的AI模型,并增强了用户体验。为了应对市场竞争,JetBrains计划推出免费套餐,吸引更多开发者使用其工具。
4). ClaudeResearch上线,深度整合Google
昨日凌晨,Anthropic宣布Claude将上线Research功能和GoogleWorkspace深度集成。Claude本次新增的Research功能,与此前OpenAI在ChatGPT中所推出的DeepResearch类似,能够主动进行多轮搜索,逐步深入问题并进行多角度探索,最后系统性地为用户提供更高质量的回答内容。值得一提的是,本次Claude的Research拥有代理式(Agentic)搜索框架,支持自主规划并执行多步骤搜索任务。
据悉,本次GoogleWorkspace依靠Anthropic的MCP协议,这也意味着Agent的形态又一次变得清晰起来,真正能让用户少动手,高回报率地获得想要的内容。
投融资情报
1). OpenAI考虑以30亿美元收购人工智能编程工具Windsurf
OpenAI正在考虑以约30亿美元收购人工智能编程工具Windsurf(原名Codeium)。如果收购成功,将是OpenAI有史以来最大的一笔交易,增强其在AI编程助手市场的竞争力。Windsurf专注于根据自然语言提示编写代码,此前曾计划按30亿美元估值融资。
文/宇霁
PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.