网易首页 > 网易号 > 正文 申请入驻

乌鸦AI日报:OpenAI o3/o4-mini「幻觉」情况更严重;首个人形机器人半马完赛

0
分享至

据 The Crunch 报道,OpenAI 近日推出的o3/o4-mini虽然在多方面有了不小的进步,然而新模型在「幻觉」内容(虚构的内容)方面,相较于旧模型会产生更多。

全球首届人形机器人半程马拉松昨日在北京开跑。北京人形机器人创新中心研发的天工 Ultra凭借 2 时 40 分 42 秒的成绩获得冠军,松延动力 N2 机器人夺得亚军,上海卓益得机器人有限公司旗下行者二号机器人获得季军。

过去一天,国内外AI行业还有更多热点可以关注,乌鸦君带你一起看看。

大模型

1)消息称OpenAIo3/o4-mini「幻觉」情况更严重

据TheCrunch报道,OpenAI近日推出的o3/o4-mini虽然在多方面有了不小的进步,然而新模型在「幻觉」内容(虚构的内容)方面,相较于旧模型会产生更多。

报道指出,据OpenAI的内部测试,o3和o4-mini两款新模型比OpenAI此前的推理模型(o1、o1-mini、o3-mini)以及传统的非推理模型,都更容易产生幻觉。

报道还表示,更令人担忧的是连ChatGPT的开发人员都不知道为何会这样:OpenAI在o3/o4-mini的技术报告中表示,需要更多的研究内容来了解为什么随着推理模型的发展,反而幻觉情况反而更糟糕这一问题。

2)昆仑万维开源SkyReels-V2:无限时长电影生成模型

昆仑万维的SkyReels团队推出了SkyReels-V2,这是全球首个基于扩散强迫框架的无限时长电影生成模型。该模型通过结合多模态大语言模型、强化学习等技术,显著提升了视频生成的质量和效率。SkyReels-V2不仅在技术上取得突破,还拓展了应用场景,包括故事生成和图生视频等,展现了其在创意内容制作领域的广泛潜力。

3)讯飞星火X1全新升级:在AI领域力争与OpenAI对抗

科大讯飞于4月21日推出了其最新的人工智能模型——讯飞星火X1,旨在与OpenAI的o1和DeepSeek R1竞争。该模型在多个领域表现出色,尤其是在教育、医疗和司法等行业。尽管其模型参数较小,但整体效果与行业领先者相当。此外,讯飞星火X1的“快思考、慢思考”统一模型为用户提供了灵活的思考方式,降低了企业使用AI的门槛。

4)谷歌发布 Gemma3QAT 模型:一张3090显卡也能轻松驾驭

谷歌近期推出了Gemma3系列的新版本,特别是经过量化感知训练(QAT)优化的Gemma327B模型,显著降低了内存需求,使得用户能够在消费级GPU上本地运行大型模型。QAT技术通过在训练过程中融入量化操作,减少了性能损失,提升了模型在小型设备上的运行效果。

5)字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理

字节跳动研究团队推出了ChatTS-14B,这是一款专为时间序列数据设计的140亿参数大型语言模型,旨在通过自然语言接口降低时间序列分析的使用门槛。该模型的开源引发了广泛关注,标志着时间序列分析与生成式AI结合的重大进展。ChatTS-14B不仅提供了模型权重,还包括详细的使用文档和代码库,助力开发者在金融、医疗等领域的应用。

AI应用

1)首个人形机器人半马完赛,宇树科技回应

全球首届人形机器人半程马拉松昨日在北京开跑。北京人形机器人创新中心研发的天工 Ultra凭借 2 时 40 分 42 秒的成绩获得冠军,松延动力 N2 机器人夺得亚军,上海卓益得机器人有限公司旗下行者二号机器人获得季军。

但根据网络流传的视频,宇树科技 G1 人形机器人在跑步过程中摔倒,此后站起继续比赛。随后,宇树科技对此发布声明回应:最近完全没有参与任何比赛,主要忙着准备人形机器人的格斗直播。

2)宇树科技宣布全球首场人形机器人格斗大赛将于2025年开战

宇树科技将在2025年举办全球首场人形机器人格斗大赛,展示尖端技术与机器人格斗的魅力。参赛的G1人形机器人经过高强度训练,展现出卓越的灵活性和强大的战斗能力,尤其是在被击倒后能迅速恢复战斗,令人印象深刻。这场赛事不仅是技术的盛会,更将推动人工智能和机器人技术的发展,吸引全球科技爱好者的关注。

3)Reachy2机器人发布:互动自然,售价7万美元

Hugging Face通过收购Pollen Robotics推出开源人形机器人Reachy2,标志着人形机器人与生成式AI结合的重要里程碑。Reachy2以其友好的外观、先进的传感器和开源特性,迅速成为全球顶尖实验室的关注焦点。该机器人不仅推动了机器人技术的主流化,也为AI和机器人研究提供了低成本的创新机会,展现了未来人形机器人市场的巨大潜力。

4)扣子空间Coze Space正式开启内测

字节跳动的全新AI协同办公平台“扣子空间”已进入内测阶段,旨在提升用户与AI Agent的协作效率。该平台具备自动分析用户需求、拆解任务、调用工具等多项创新功能,能够生成完整的结果报告。此外,平台引入了专家Agent生态,用户可选择不同领域的专家进行深度分析,帮助获取更多洞察。

5)Intel 开源 AI Playground,可用intel Arc 显卡使用各种AI模型

Intel 宣布将其生成式 AI 软件 AI Playground 正式开源,标志着在推动生成式 AI 技术普及和社区协作方面的重要一步。AI Playground 是一款专为 Intel Arc GPU 和集成显卡优化的工具,支持多种生成式 AI 模型,允许用户在本地生成 AI 图像并确保数据隐私。

6)Figma 推 AI 革命:开发智能应用制作器与网站创建工具

Figma正积极布局人工智能领域,计划推出一款AI应用程序制作器和Figma Sites网站创建工具。这些新工具旨在通过自然语言和现有设计资源快速生成应用程序和网站,降低开发门槛,使非技术背景的设计师也能轻松构建功能性应用。Figma的这一系列创新不仅提升了设计与开发的智能化水平,还可能重新定义行业协作模式,尽管面临来自Webflow和Wix等平台的竞争。

7)聊天机器人测评平台 Chatbot Arena 正式转型为商业公司

据彭博社报道,大模型竞技场 Chatbot Arena 正式宣布转型为商业公司 LMArena。Chatbot Arena 创立于 2023 年初,最初是加州大学伯克利分校天空计算实验室(Sky Computing Lab)的一个学术研究项目,如今每月吸引超过一百万访客,已发展成为 AI 基准测试领域的权威指标。

LMArena 目前发布了新网站的早期版本,但尚未确定具体的商业模式。一种可能性是向希望通过该网站测试 AI 模型的公司收费。创始人 Ion Stoica 表示,公司计划筹集资金支持未来发展,但拒绝透露更多融资细节。

整理/宇霁

PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刘国梁到底有多狠?弃用郝帅和陈玘,用天才前途换国乒的万无一失

刘国梁到底有多狠?弃用郝帅和陈玘,用天才前途换国乒的万无一失

老玮是个手艺人
2026-03-27 14:46:10
女子薯片中吃出穿戴甲?称上好佳提赔付后改口,客服:全自动化生产,无人工参与

女子薯片中吃出穿戴甲?称上好佳提赔付后改口,客服:全自动化生产,无人工参与

界面新闻
2026-05-19 16:45:03
家里老人过世,这两人千万别通知,否则会惹麻烦,切记!

家里老人过世,这两人千万别通知,否则会惹麻烦,切记!

水泥土的搞笑
2026-05-20 13:09:05
4楼、14楼、18楼的房子不能买?错了,真正不能买的楼层是这5个

4楼、14楼、18楼的房子不能买?错了,真正不能买的楼层是这5个

装修秀
2026-05-16 17:04:22
这18个表现,占五个你还不算老,全占,说明你是100%老人了

这18个表现,占五个你还不算老,全占,说明你是100%老人了

暖风吹过竹林
2026-05-19 13:21:35
夕又米晒三世同堂照庆木婚,4岁儿子虎头虎脑,18岁女儿留学国外

夕又米晒三世同堂照庆木婚,4岁儿子虎头虎脑,18岁女儿留学国外

娱珈歪歪鱼
2026-05-18 15:38:13
7旬老人农家乐养老2年,每月2600,老人坦言:这比养老院舒心多了

7旬老人农家乐养老2年,每月2600,老人坦言:这比养老院舒心多了

人间百态大全
2026-05-19 06:40:03
涉事医生被停职!医院向患者真诚道歉!这次,医生被罚不冤

涉事医生被停职!医院向患者真诚道歉!这次,医生被罚不冤

梅斯医学
2026-05-20 10:07:23
幸福来的太及时:发射中国霹雳导弹的法国“幻影-5”

幸福来的太及时:发射中国霹雳导弹的法国“幻影-5”

一个幻想者
2026-05-20 08:46:09
于根伟胆子真大!本轮中超将吴兴涵换上又换下,背后原因找到了

于根伟胆子真大!本轮中超将吴兴涵换上又换下,背后原因找到了

振刚说足球
2026-05-20 14:33:05
汪小菲心酸取关小玥儿,张兰坦然承认,并接受一切事物发生

汪小菲心酸取关小玥儿,张兰坦然承认,并接受一切事物发生

一盅情怀
2026-05-18 17:34:12
爱尔眼科补税超5亿元

爱尔眼科补税超5亿元

经济观察报
2026-05-20 13:56:24
造不出顶尖芯片?不慌,靠祖籍把造芯片的CEO都变成自己人

造不出顶尖芯片?不慌,靠祖籍把造芯片的CEO都变成自己人

可达鸭面面观
2026-05-19 17:03:56
“银针忘拔效果好?”针灸被留两根针在体内,医馆回复气炸全网

“银针忘拔效果好?”针灸被留两根针在体内,医馆回复气炸全网

一丝不苟的法律人
2026-05-20 14:47:07
1343万亿债务爆雷!日本股债汇三杀,中方果断不救日元

1343万亿债务爆雷!日本股债汇三杀,中方果断不救日元

观察者海风
2026-05-20 13:00:00
湖北儿媳住院公公陪护,趁护士换药递纸条,护士看后果断报警

湖北儿媳住院公公陪护,趁护士换药递纸条,护士看后果断报警

清茶浅谈
2025-02-21 18:50:59
全场跑动倒数第一!穆里尼奥忍不了了,皇马头号巨星要被清洗

全场跑动倒数第一!穆里尼奥忍不了了,皇马头号巨星要被清洗

奶盖熊本熊
2026-05-20 04:01:45
3岁女童高铁座位与母亲相隔8节车厢 12306:余票不足时随机分配

3岁女童高铁座位与母亲相隔8节车厢 12306:余票不足时随机分配

快科技
2026-05-19 19:19:19
莫斯科遭全面战争以来最大袭击,乌方一句“战争回来了”刺痛俄方

莫斯科遭全面战争以来最大袭击,乌方一句“战争回来了”刺痛俄方

桂系007
2026-05-17 23:47:11
夺冠窗口期就是这两年,马刺的竞争力想要有进一步提升并不容易?

夺冠窗口期就是这两年,马刺的竞争力想要有进一步提升并不容易?

稻谷与小麦
2026-05-19 21:53:29
2026-05-20 15:31:00
硅基观察Pro incentive-icons
硅基观察Pro
人工智能新时代的商业智库和价值灯塔
900文章数 65关注度
往期回顾 全部

科技要闻

一文看懂谷歌I/O2026:谷歌打响智能体大战

头条要闻

媒体:特朗普不希望"台独"倚仗美 马科斯堪称回应得快

头条要闻

媒体:特朗普不希望"台独"倚仗美 马科斯堪称回应得快

体育要闻

不再美丽的阿森纳,终于成为英超冠军

娱乐要闻

舒淇大方承认:卸了妆就是50 岁的模样

财经要闻

白酒榜|汾酒营收净利双增 口子窖"造富"

汽车要闻

焕新极氪009上市41.38万起 齐家版让MPV回归家庭

态度原创

亲子
健康
旅游
数码
公开课

亲子要闻

2026 买前必看:驼奶粉品牌的配料表怎么看才正规?一眼识破假驼奶

专家:别把PRP当作“自体干细胞”

旅游要闻

念青唐古拉倒映,棕头鸥斜飞,雪域纳木错解冻“开湖”

数码要闻

微星发布首款5层串联QD-OLED显示器:320Hz高刷 抗刮性能提2.5倍

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版