网易首页 > 网易号 > 正文 申请入驻

什么是生成式AI

0
分享至

您的关注是对我最大的支持

『 AI每日快讯 欢迎大家转载、引用、分享,让更多人了解AI,学习AI 』

生成式人工智能无处不在。事实上,像OpenAI的ChatGPT这样的生成式AI,它展示了一种似乎由人类编写的生成文本的惊人能力,使得一些头条新闻可能实际上是由它撰写的。

但当人们谈论“生成式AI”时,他们到底指的是什么?

在过去几年的生成式AI热潮之前,当人们谈论AI时,通常是指能够基于数据进行预测的机器学习模型。例如,这些模型通过数百万例子的训练,可以预测某个X射线是否显示出肿瘤的迹象,或者某个借款人是否可能违约。

生成式AI可以被认为是一种被训练来创建新数据的机器学习模型,而不是对特定数据集进行预测。生成式AI系统是一种学会生成类似于其训练数据的更多对象的系统。

麻省理工学院电气工程与计算机科学副教授、计算机科学与人工智能实验室(CSAIL)成员Phillip Isola说:“在生成式AI和其他类型AI的实际机制方面,区别可能有点模糊。通常,同样的算法可用于两者。”

尽管ChatGPT及其同类产品的发布伴随着炒作,但这项技术本身并不是全新的。这些强大的机器学习模型依赖于超过50年的研究和计算进展。

复杂度的提升

生成式AI的一个早期示例是一种更简单的模型,称为马尔可夫链。这项技术以1906年引入这种统计方法来模拟随机过程的俄罗斯数学家安德烈·马尔可夫的名字命名。在机器学习中,马尔可夫模 型长期用于诸如电子邮件程序中的自动完成功能之类的下一个词预测任务。

麻省理工学院电气工程与计算机科学的Thomas Siebel教授、CSAIL和数据、系统与社会研究所(IDSS)成员Tommi Jaakkola说,在文本预测中,马尔可夫模型通过查看前一个单词或几个前面的单词来生成句子中的下一个单词。但由于这些简单模型只能回溯这么远,它们不擅长生成可信的文本。

他解释道:“我们在过去十年之前就在生成东西,但主要区别在于我们可以生成的对象的复杂性,以及我们可以训练这些模型的规模。”

就在几年前,研究人员还倾向于寻找一种机器学习算法,以最佳利用特定数据集。但这种重点已经有所转变,许多研究人员现在使用更大的数据集——可能包含数亿甚至数十亿数据点——来训练能够取得令人印象深刻结果的模型。

作为马尔可夫模型的基础模型,ChatGPT及类似系统的基础模型工作方式大致相同。但一个很大的区别是,ChatGPT的规模远大且更为复杂,拥有数十亿参数。它接受了大量数据的训练——在这种情况下,是互联网上大部分公开可用的文本。

在这庞大的文本语料库中,单词和句子以某些依赖性出现在序列中。这种重复性帮助模型了解如何将文本切割成具有一定可预测性的统计块。它学习这些文本块的模式,并使用这些知识来提出接下来可能出现的内容。

更强大的架构

虽然更大的数据集是引发生成式AI热潮的一个催化剂,但多项重大研究进展也导致了更复杂的深度学习架构的发展。

2014年,蒙特利尔大学的研究人员提出了一种名为生成对抗网络(GAN)的机器学习架构。GAN使用两个模型协同工作:一个学习生成目标输出(如图像),另一个学习区分真实数据和生成器输出。生成器试图欺骗鉴别器,并在此过程中学会制作更逼真的输出。图像生成器StyleGAN基于这些类型的模型。

斯坦福大学和加州大学伯克利分校的研究人员在一年后引入了扩散模型。通过迭代地完善它们的输出,这些模型学会生成类似于训练数据集中样本的新数据样本,并已被用于创建逼真的图像。文本到图像生成系统Stable Diffusion的核心就是扩散模型。

2017年,谷歌的研究人员引入了变压器架构,用于开发大型语言模型,如ChatGPT的动力。在自然语言处理中,变压器将文本语料库中的每个单词编码为一个标记,然后生成一个注意力图,该图捕获每个标记与所有其他标记的关系。这个注意力图帮助变压器在生成新文本时理解上下文。

这些只是用于生成式AI的众多方法中的几种。

应用范围

所有这些方法的共同点是,它们将输入转换为一组标记,这些标记是数据块的数值表示。只要你的数据可以转换成这种标准的标记格式,那么理论上,你可以应用这些方法来生成看起来类似的新数据。

Isola说:“你的成效可能会有所不同,这取决于你的数据有多嘈杂以及提取信号的难度,但它确实越来越接近通用CPU可以接收任何类型的数据并以统一的方式开始处理的方式。”

这为生成式AI打开了一个巨大的应用阵列。

例如,Isola的小组正在使用生成式AI创建合成图像数据,这些数据可以用于训练另一个智能系统,例如教授计算机视觉模型如何识别对象。

Jaakkola的小组正在使用生成式AI设计新颖的蛋白质结构或指定新材料的有效晶体结构。就像生成模型学习语言的依赖性一样,如果向它展示晶体结构,它可以学习使结构稳定和实现的关系。

但是,尽管生成模型可以取得令人难以置信的结果,它们并不是所有类型数据的最佳选择。麻省理工学院电气工程与计算机科学教授、信息和决策系统实验室成员Devavrat Shah指出,对于涉及对结构化数据(如电子表格中的数据)进行预测的任务,传统的机器学习方法往往比生成人工智能模型表现更佳。

他说:“在我看来,它们最大的价值是成为一个非常好的、对人类友好的机器接口。以前,人们必须用机器语言与机器交流以完成任务。现在,这个接口已经学会了如何同时与人类和机器沟通。”

提出风险

生成人工智能聊天机器人现在被用于呼叫中心处理人类客户的问题,但这一应用强调了实施这些模型的一个潜在风险 —— 工人被取代。

此外,生成人工智能可能会继承并扩散训练数据中存在的偏见,或放大仇恨言论和虚假陈述。这些模型具有剽窃的能力,可以生成看似由特定人类创作者制作的内容,引发潜在的版权问题。

另一方面,Shah提出,生成人工智能可以赋予艺术家权力,他们可以使用生成工具帮助他们制作他们可能无法自己生产的创意内容。

他预见,在未来,生成人工智能将改变许多学科的经济学。

麻省理工学院电子工程与计算机科学副教授、计算机科学与人工智能实验室成员Phillip Isola看到生成人工智能的一个有前途的未来方向是其在制造方面的应用。他提到,与其让模型制作一张椅子的图像,不如生成一张可以生产的椅子的计划。

他还看到生成人工智能系统在开发更普遍智能的人工智能代理中的未来用途。

他说:“这些模型的工作方式与我们认为人类大脑的工作方式之间存在差异,但我认为也有相似之处。我们能够在头脑中思考和梦想,提出有趣的想法或计划,我认为生成人工智能是将使代理能够做到这一点的工具之一。”

关注我,每天领取AI领域最新大事

设置⭐️标不迷路

转发朋友圈为您朋友播报每日AI大事

进交流群请扫下面码







您的关注是对我最大的支持

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
今日最佳:民用C4

今日最佳:民用C4

差评XPIN
2026-03-23 00:09:07
见到哪些因作死被开除的员工?网友:第一天就被开了

见到哪些因作死被开除的员工?网友:第一天就被开了

另子维爱读史
2026-03-20 19:38:49
被AI“偷走”声音 配音演员集体维权:希望构建合法共存生态

被AI“偷走”声音 配音演员集体维权:希望构建合法共存生态

齐鲁壹点
2026-03-22 10:00:40
金卡戴珊东京街头大秀恩爱,亲密挽手F1车王,甜笑互动坐实恋情

金卡戴珊东京街头大秀恩爱,亲密挽手F1车王,甜笑互动坐实恋情

世界王室那些事
2026-03-23 14:02:58
网红富二代王政源被判入狱两年半,罚1500万,央视财经9分大制作

网红富二代王政源被判入狱两年半,罚1500万,央视财经9分大制作

裕丰娱间说
2026-03-23 08:55:04
模拟画像与真人相似度不足30%?落网的“梅姨”到底长啥样,为何如此难抓?

模拟画像与真人相似度不足30%?落网的“梅姨”到底长啥样,为何如此难抓?

新民周刊
2026-03-22 15:34:46
全球崩了,真凶是……

全球崩了,真凶是……

凤凰网财经
2026-03-22 22:41:19
解放前的西藏有多黑暗?触目惊心,少女沦为玩物,农民不如耗牛

解放前的西藏有多黑暗?触目惊心,少女沦为玩物,农民不如耗牛

新一说史
2026-03-12 19:26:35
有网友吐槽:雷军选舒淇做SU7代言人是臭棋!不知道她的过去?

有网友吐槽:雷军选舒淇做SU7代言人是臭棋!不知道她的过去?

大白聊IT
2026-03-23 12:17:25
董洁自曝体重从80斤涨到90斤:已经不敢上称,调养身体反而长胖了;网友:太离谱,健康美才最重要

董洁自曝体重从80斤涨到90斤:已经不敢上称,调养身体反而长胖了;网友:太离谱,健康美才最重要

台州交通广播
2026-03-21 23:07:07
爸妈!真的不要再往马桶里倒水了!

爸妈!真的不要再往马桶里倒水了!

家居设计师宅哥
2026-03-08 18:21:44
世乒赛第二次选拔结束,国乒第7人诞生!王艺迪、陈熠出局

世乒赛第二次选拔结束,国乒第7人诞生!王艺迪、陈熠出局

十点街球体育
2026-03-22 21:07:21
亚朵,挤满偷偷开房的成年人

亚朵,挤满偷偷开房的成年人

广告案例精选
2025-10-03 15:00:51
错过三大机遇、败光前任家底!莫迪这十年,把印度打成二流国家

错过三大机遇、败光前任家底!莫迪这十年,把印度打成二流国家

观史搜寻着
2026-03-23 10:43:49
驻日武官王庆简:为日本潜伏20年出卖军事机密,却因一动作暴露身份

驻日武官王庆简:为日本潜伏20年出卖军事机密,却因一动作暴露身份

睡前讲故事
2026-02-03 20:55:43
又被李嘉诚说中了!中国手握两套房以上的家庭,未来只有3种结局

又被李嘉诚说中了!中国手握两套房以上的家庭,未来只有3种结局

寻墨阁
2026-03-23 08:52:28
“最强地级市”市长,拟任新职

“最强地级市”市长,拟任新职

上观新闻
2026-03-23 13:46:13
为什么WTO很少被提起了?中国入世谈判花了15年,如今几乎被架空

为什么WTO很少被提起了?中国入世谈判花了15年,如今几乎被架空

混沌录
2026-03-21 15:31:24
宁愿销毁也不卖给中国!现在却又求着中国买,专家:白送都不要!

宁愿销毁也不卖给中国!现在却又求着中国买,专家:白送都不要!

混沌录
2026-03-22 23:18:10
日经225指数向下跌破51000点,最新报50966.59点,日内下跌4.51%

日经225指数向下跌破51000点,最新报50966.59点,日内下跌4.51%

每日经济新闻
2026-03-23 08:50:24
2026-03-23 14:52:49
AI最新追踪 incentive-icons
AI最新追踪
专注于AI相关的最新动态,关注我,随时掌握AI最新消息
155文章数 22关注度
往期回顾 全部

科技要闻

雷军、蔡崇信最新发声,提到同一件事

头条要闻

以色列大规模轰炸伊首都基础设施 德黑兰弥漫刺鼻气味

头条要闻

以色列大规模轰炸伊首都基础设施 德黑兰弥漫刺鼻气味

体育要闻

不敢放手一搏,你拿什么去争冠?

娱乐要闻

刘烨47岁生日,安娜晒全家福为其庆生

财经要闻

沪指跌逾3% 下跌个股近5100只

汽车要闻

岚图汽车香江鸣锣 一场关于"国家队"的突围实验

态度原创

健康
亲子
教育
手机
军事航空

转头就晕的耳石症,能开车上班吗?

亲子要闻

男子分享普通家庭对孩子的托举,“做好这5点 陪孩子健康成长”,网友:每一点对孩子都很重要

教育要闻

青春期孩子,总是愤怒,无原由的愤怒

手机要闻

IDC:2025年中国无线耳机出货12137万台同比增长6.9%

军事要闻

伊朗回应美方威胁:将在战场上坚决对抗

无障碍浏览 进入关怀版