近日,从北京市人工智能产业投资基金获悉,该基金追加投资北京智谱华章科技股份有限公司(简称智谱)2 亿人民币。
据《金融时报》消息,由 OpenAI 与软银主导的、高达 5000 亿美元的美国 AI 数据中心项目「Stargate(星际之门)」,正在考虑未来在英国进行投资,旨在将超强 AI 模型所需的基础设施版图,扩大至全球范围。
过去一天,国内外AI行业还有更多热点可以关注,乌鸦君带你一起看看。
大模型
1)阿里通义万相开源业内首个「首尾帧生视频模型」
昨晚,阿里通义宣布开源业内首个「首尾帧生视频模型」—— Wan2.1-FLF2V-14B,只需要提供两张照片作为首帧和尾帧,模型便能自动生成一段丝滑流畅的高清视频。
官方介绍,本次开源的「首尾帧生视频模型」基于 Wan2.1 文生视频 14B(参数量)大模型打造,支持生成时长 5 秒的 720p 高清视频。据了解,阿里通义发布的 Wan2.1 系列模型采用了先进的 DiT 架构。
2)Google 推出 Gemini 2.5 Flash 预览版
今日凌晨,Google 正式推出 Gemini 2.5 Flash 预览版大模型,基于 Gemini 2.0 Flash 打造,其在推理能力方面进行了较大升级,同时保持了速度和成本的优势。
据 Gemini 产品经理 Tulsee Doshi 表示,Gemini 2.5 Flash 与 2.5 Pro 一样,支持动态思考:根据输入的复杂程度自动调整生成的工作量。在 2.5 Flash 上,开发者可以进一步控制模型思考。另外,Google 将优化性能,计划推出正式版,或支持更长上下文(200 万 Tokens)和更低延迟。
3)理想同学MindGPT 3.0 发布
4 月 17 日,理想同学基座模型 MindGPT 3.0 正式发布,据悉,这是一款基于结构化思维链的深度思考模型。
官方介绍,MindGPT 3.0 模型能力全面升级:
长思维链推理能力取得突破,性能对标 DeepSeek-V3-0324(短思维链)及 DeepSeek-R1(长思维链),基于监督微调和强化学习结合的思维链增强技术;
具备深度推理、高质量反思、持续探索等推理能力,模型在复杂问题解决、多模态理解及推理、工具使用等方面的能力显著增强。
结合动态窗口与智能分片技术,MindGPT 3.0 最高支持两百万分辨率的图片输入;依托于 MindGPT 3.0 强大的语言能力,新版本的看世界 Agent 拥有更好的表达和推理能力,并在多个基准测试中超过 GPT4.5 和 GPT-4o。
基于 Mind GPT 3.0 强大的内容理解能力,播客 Agent 采用的语音合成(TTS)技术升级,升级为对话式长文本语音合成大模型,拥有更强的对话感和更准确的情绪表达。
目前,理想同学正式上线基于 MindGPT 3.0 的深度思考能力,在理想同学手机 App 及网页版均可免费使用。
4)腾讯混元InstantCharacter开源,高度角色一致性、自定义姿势、样式和场景
腾讯混元团队正式开源了InstantCharacter框架,这一基于扩散变换器的角色个性化工具,具备高一致性和灵活性,能够从单张图像生成多样化的角色定制,适用于多种艺术风格。该框架的开源将降低角色定制的技术门槛,激发全球开发者的创新热情,同时也需关注版权和伦理问题。
AI应用
1)苹果 AI 功能遭 Meta「拒之门外」
据媒体 Sorcererhat 发现,Meta 旗下的 App 屏蔽了苹果 AI 功能(Apple Intelligence)。报道指出,目前包括 Facebook、WhatsApp、Threads 在内的 Meta 系 App,均无法调用 Apple Intelligence 的功能:
用户在上述 App 中无法使用 Apple Intelligence 中的 Writing Tools 工具,进行创建、修改或校对文本;也无法生成和分享 Genmoji。但在 X(原为 Twitter)等其他 App 中能正常调用 Apple Intelligence 的功能。
2)OpenAI推出Flex处理API,助力低成本 AI 应用
OpenAI最近推出了Flex处理API,以应对激烈的人工智能市场竞争。该API允许用户以更低的成本使用AI模型,尽管在响应速度和可用性上有所妥协。Flex处理特别适合低优先级和非生产性任务,显著降低了使用成本,尤其在当前AI服务普遍上涨的背景下,提供了一个经济实惠的选择。
3)Midjourney图像编辑器迎来重大更新:全新UI、图层功能与智能工具上线
Midjourney于2025年4月17日发布了其图像编辑器的重要更新,优化了用户体验并引入了多项创新功能,包括全新的用户界面、图层功能、智能选择工具和升级的内容审核机制。这些改进不仅提升了编辑效率和灵活性,还增强了平台的安全性,进一步巩固了Midjourney在AI创意工具领域的领先地位。
4)Genspark Super Agent新增文件转换工具,支持转换超400种文件格式
Genspark Super Agent推出了全新的文件转换工具,支持超过400种文件格式的互转,极大提升了用户的办公效率。该工具操作简便,用户只需上传文件并选择目标格式,即可快速完成转换。其智能优化和无缝集成的特点,使得这一工具成为个人和企业用户在日常办公中不可或缺的助手。
AI基础设施
1)OpenAI 和软银计划在英扩展「星际之门」项目
据《金融时报》消息,由 OpenAI 与软银主导的、高达 5000 亿美元的美国 AI 数据中心项目「Stargate(星际之门)」,正在考虑未来在英国进行投资,旨在将超强 AI 模型所需的基础设施版图,扩大至全球范围。
据多名知情人士透露,目前英国已成为 Stargate 向外扩张的首选之一。而上述情况与英国政府近期通过加大 AI 行业的投资力度有关,其中为开发者提供更便捷的能源获取被尤为看重。另据参与 Stargate 项目的知情人士表示,该项目希望去达算力密集的地方,德国和法国也是该项目的关注对象。
目前,Stargate 首个数据中心综合体已经落地美国德州阿比林。此前据彭博社报道,首期计划中,该数据中心可容纳多达 40 万个英伟达的 AI 芯片。
AI基础设施
1)智谱获北京市人工智能产业投资基金追投 2 亿元
近日,从北京市人工智能产业投资基金获悉,该基金追加投资北京智谱华章科技股份有限公司(简称智谱)2 亿人民币。
北京市人工智能产业投资基金表示,智谱是基金成立以来投资的第一家 AI 大模型企业,也是目前成长最快的企业。智谱在包括文本、推理、语音、图像、视频、代码等在内的全面模型能力上有深厚积累。此外,商业化布局完善,拥有超过百万规模的开发者社区和企业用户。
整理/宇霁
PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.