网易首页 > 网易号 > 正文 申请入驻

2024 年另类 AI 评测标准走红:“威尔・史密斯吃意大利面”领衔

0
分享至

IT之家 1 月 1 日消息,据 TechCrunch 报道,随着人工智能视频生成技术的不断发展,一个有趣的现象开始在业内流行:当一家公司发布全新的人工智能视频生成器时,似乎总有人会第一时间用它来制作威尔・史密斯吃意大利面的视频。这不仅演变成了一种网络热梗,更成为衡量新型 AI 视频生成器性能的非官方基准 —— 检验其能否逼真地呈现史密斯狼吞虎咽吃面的场景。史密斯本人也在今年二月通过 Instagram 发布了一段模仿视频,亲自参与了这场网络狂欢。

IT之家注意到,“威尔・史密斯吃意大利面”只是 2024 年人工智能领域众多奇特“非官方”评测标准中的一个,此前还有一位 16 岁的开发者开发了一款应用程序,让人工智能控制《我的世界》(Minecraft)游戏,并以此测试其建筑设计能力。与此同时,还有一位英国程序员创建了一个平台,让人工智能在“你画我猜”(Pictionary)和“四子棋”(Connect 4)等游戏中相互对战。

人工智能领域不乏更学术化的性能测试,那么为何这些略显怪异的测试反而能够迅速走红呢?原因之一在于,许多行业标准的人工智能基准测试对普通人来说过于晦涩难懂。企业经常标榜其人工智能在奥林匹克数学竞赛或博士级别难题中的解题能力,但大多数人使用聊天机器人只是为了聊天或回复电子邮件。

即使是行业内普遍采用的评测方法,也未必更有效或更具信息量。以受到众多人工智能爱好者和开发者密切关注的公共基准测试平台“聊天机器人竞技场”(Chatbot Arena)为例,其允许任何网络用户对 AI 在特定任务上的表现进行评分,例如创建网页应用程序或生成图像。但参与评分的用户往往不具有代表性,他们大多来自人工智能和科技行业,并且他们的投票也常常基于个人且难以捉摸的偏好。

像“四子棋”“我的世界”和“威尔・史密斯吃面条”这类奇特的人工智能基准测试显然不是严谨的实证研究,甚至不具备普遍适用性。因为即便 AI 能够完美生成“威尔・史密斯吃面条”的视频,也并不意味着其能很好地生成汉堡的图像。

这些另类的 AI 基准测试可能在短期内不会消失,毕竟它们不仅具有娱乐性,而且还易于理解。2025 年,又会有哪些新奇的基准测试会走红呢?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
WNBA:李月汝末节称霸,全场最高+18,战胜旧主

WNBA:李月汝末节称霸,全场最高+18,战胜旧主

体娱荒原
2026-05-21 12:14:25
美元慌了!人民币硬刚逆袭,资金疯狂涌来6.7只是起步

美元慌了!人民币硬刚逆袭,资金疯狂涌来6.7只是起步

三农老历
2026-05-21 13:03:00
小偷彻底失业了!根本不仅是监控多,而是偷东西不赚钱了

小偷彻底失业了!根本不仅是监控多,而是偷东西不赚钱了

猫叔东山再起
2026-05-14 10:15:08
张本智和连夜搬空日本豪宅,21岁世界第三为何甘愿“逃跑”?

张本智和连夜搬空日本豪宅,21岁世界第三为何甘愿“逃跑”?

南宗历史
2026-05-20 00:53:41
承诺“不限次数”,就该接住顾客的“天天来”

承诺“不限次数”,就该接住顾客的“天天来”

南风不及你温柔
2026-05-16 01:02:57
拉胳膊、扯头发,无所不用其极!雷霆扳平系列赛!独行侠大洗牌,欧文潜在下家出炉!!

拉胳膊、扯头发,无所不用其极!雷霆扳平系列赛!独行侠大洗牌,欧文潜在下家出炉!!

顺静自然
2026-05-21 13:20:52
60~80岁老人,这8条满足五条,你就是万里挑一的老人,你占几条

60~80岁老人,这8条满足五条,你就是万里挑一的老人,你占几条

暖风吹过竹林
2026-05-21 13:50:19
金彭贝:姆巴佩回防不跑动的时候,真把我累够呛

金彭贝:姆巴佩回防不跑动的时候,真把我累够呛

懂球帝
2026-05-21 12:39:04
主角:直到楚嘉禾爬上刘红兵的床,才懂易青娥两段婚姻为何告终

主角:直到楚嘉禾爬上刘红兵的床,才懂易青娥两段婚姻为何告终

慢半拍sir
2026-05-20 21:42:39
罗欣药业阿奇霉素被定性“劣药”,被罚款186.84万元

罗欣药业阿奇霉素被定性“劣药”,被罚款186.84万元

新浪财经
2026-05-21 03:41:11
雪上加霜!法院出手后,王健林传坏消息,原来他和许家印处境一样

雪上加霜!法院出手后,王健林传坏消息,原来他和许家印处境一样

林轻吟
2026-04-18 07:46:46
樊振东欧冠20分钟横扫夺冠,门票72小时售罄暴涨620%

樊振东欧冠20分钟横扫夺冠,门票72小时售罄暴涨620%

别让往昔的悲伤和对未来的恐惧
2026-05-21 08:40:27
家门口放这3样东西,再富裕也会败光,赶紧清理!

家门口放这3样东西,再富裕也会败光,赶紧清理!

一口娱乐
2026-05-21 10:39:55
1-2!北京不敌上海,赛后还有4个坏消息,周琦和球队貌合神离

1-2!北京不敌上海,赛后还有4个坏消息,周琦和球队貌合神离

鲸探所长
2026-05-21 14:32:37
葡超游出一条阿根廷大鱼,良心价3200万欧元,两大英超豪门疯抢

葡超游出一条阿根廷大鱼,良心价3200万欧元,两大英超豪门疯抢

零度眼看球
2026-05-21 09:04:45
科主任被免职,涉事医生辞职!

科主任被免职,涉事医生辞职!

音乐时光的娱乐
2026-05-21 10:14:51
36国抱团围堵中方一致同意对付,48小时内中企遭催卖资产

36国抱团围堵中方一致同意对付,48小时内中企遭催卖资产

星星会坠落
2026-05-21 14:43:13
74岁布丽吉特:为了马克龙,整容扮嫩撑了9年,如今终于可以解脱

74岁布丽吉特:为了马克龙,整容扮嫩撑了9年,如今终于可以解脱

毒舌小红帽
2026-05-14 16:09:46
女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

蝴蝶花雨话教育
2026-05-07 00:05:04
清理门户!武契奇访华前强硬表态:不惜一切代价铲除军中黑恶势力

清理门户!武契奇访华前强硬表态:不惜一切代价铲除军中黑恶势力

有范又有料
2026-05-21 12:08:35
2026-05-21 15:28:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
345378文章数 607211关注度
往期回顾 全部

科技要闻

好到离谱也不够!英伟达交出816亿美元营收

头条要闻

小学网购45把雨伞全损退货 记者采访门卫称领导都不在

头条要闻

小学网购45把雨伞全损退货 记者采访门卫称领导都不在

体育要闻

常住人口7000的小镇,拥有了一支德甲球队

娱乐要闻

同行吐槽汪涵野心重 爆雷37万人受损

财经要闻

英伟达业绩超预!指引再新高仍不够亮眼

汽车要闻

26.98万起步 看小鹏GX如何诠释一车多能以及满配的科技与豪华

态度原创

手机
教育
家居
健康
军事航空

手机要闻

四月排名出炉:华为远远领先,OPPO第二,vivo第四

教育要闻

差点失去美国普渡大学名额!亲赴招生办求情,倾力相助终迎转机!

家居要闻

风格碰撞 个性与艺术

专家:别把PRP当作“自体干细胞”

军事要闻

伊朗警告:任何新袭击将促使战场扩大到中东以外

无障碍浏览 进入关怀版