网易首页 > 网易号 > 正文 申请入驻

OpenAI最新发布:只需15秒音频,Voice Engine即可帮助失语者“重获声音”

0
分享至


今日凌晨,OpenAI 在官网分享了他们在 AI 语音合成方面的一些进展——公布了一个名为“语音引擎”(Voice Engine)的模型的小规模预览的初步见解和结果。

据介绍,该模型使用文本输入和单个 15 秒音频样本来生成与原始说话者非常相似的自然语音。值得注意的是,一个只有 15 秒样本的小型模型就能生成富有感情和逼真的声音。

早在 2022 年底,OpenAI 便开发了 Voice Engine 并将其用于支持文本到语音 API 中的预设语音以及 ChatGPT 语音和朗读。

今天,通过一些实际案例,OpenAI 分享了一些 Voice Engine 的早期应用

例如,使用 Voice Engine 帮助恢复一名因血管性脑肿瘤而失去流利语言能力的年轻患者的声音。

此外,Voice Engine 还可以被用来提供阅读帮助、翻译内容、为不会说话的人群提供支持等。

1)通过声音自然、富有感情的声音为非阅读者和儿童提供阅读帮助

这些声音代表了更广泛的说话者,而不是预设的声音。Age of Learning 是一家教育技术公司,该公司一直在使用 Voice Engine 生成预设的画外音(voice-over)内容。他们还利用 Voice Engine 和 GPT-4 创建实时、个性化的回应,与学生互动。

2)翻译视频和播客等内容

Voice Engine 可以让创作者和企业可以用自己的声音流利地向世界各地更多的人传播。据 OpenAI 介绍,HeyGen 是这方面的早期应用者之一。HeyGen 是一个人工智能视觉故事平台,通过使用 Voice Engine 进行视频翻译,将演讲者的声音翻译成多种语言,并覆盖全球受众。用于翻译时,Voice Engine 会保留原说话者的母语口音:例如,用法语说话者的音频样本生成英语,就会产生带有法语口音的语音。

3)为不会说话的人群提供支持

Voice Engine 可以为患有影响语言的疾病的人群提供治疗应用,为有学习需求的人群提供教育增强功能等。Livox 是一款人工智能替代性交流应用程序,为辅助性和替代性交流(AAC)设备提供支持,使残疾患者能够进行交流。Voice Engine 能够为不会说话的人群提供多种语言的独特非机器人语音。用户可以选择最能代表自己的语音,对于多语种用户,每种口语都能保持一致的语音。

此外,Voice Engine 还通过改善偏远地区的基本服务提供深入全球社区。例如,Dimagi 正在为社区卫生工作者开发工具,从而提供各种基本服务,如“为母乳喂养的母亲提供咨询”。为了帮助这些工作人员提高技能,Dimagi 使用 Voice Engine 和 GPT-4 以每位工作人员的主要语言(包括斯瓦希里语或更加非正式的语言)提供互动反馈。

OpenAI 表示,由于合成语音有可能被滥用,他们对更广泛的发布采取了谨慎和知情的态度,选择在此时预览但不广泛发布这项技术。

他们在与这些合作伙伴签订的条款中,要求获得原发言人的明确和知情同意,且不允许开发人员为个人用户创建自己的声音。这些合作伙伴还必须向受众明确披露,其听到的声音是人工智能生成的。

此外,OpenAI 还实施了一系列安全措施,包括水印以追踪 Voice Engine 生成的任何音频的来源,以及主动监控其使用情况。

OpenAI 表示,他们鼓励在未来加快开发和采用追踪视听内容来源的技术,让人们始终清楚自己是在与真人互动还是在与人工智能互动,并帮助公众了解人工智能技术的能力和局限性,包括人工智能欺骗性内容的可能性等。

参考资料:

https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

|点击关注我 记得标星|

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国强烈请求中国帮忙,还给我国500亿建一桥梁,到底有多难?

美国强烈请求中国帮忙,还给我国500亿建一桥梁,到底有多难?

平祥生活日志
2024-05-25 07:30:13
不说假话,说真话也得小心

不说假话,说真话也得小心

北京老付
2024-06-27 09:39:13
美国被乌克兰骗了!乌军把援助的武器,转手卖到黑市赚钱了!

美国被乌克兰骗了!乌军把援助的武器,转手卖到黑市赚钱了!

笔墨V
2024-06-29 21:51:42
2换1,大交易后,广东下赛季稳了,周琦却左右为难

2换1,大交易后,广东下赛季稳了,周琦却左右为难

体育新角度
2024-06-30 10:19:26
姜萍事件大反转,官方证实其月考83分不及格,北大数学家下场质疑

姜萍事件大反转,官方证实其月考83分不及格,北大数学家下场质疑

八爪娱先锋
2024-06-28 13:47:14
清朝官员宴请外宾时的小型宴会,众官员作陪的罕见留影

清朝官员宴请外宾时的小型宴会,众官员作陪的罕见留影

视点历史
2024-06-29 00:05:02
泽连斯基:俄罗斯进攻哈尔科夫失败,克里姆林宫正在考虑如何脱身

泽连斯基:俄罗斯进攻哈尔科夫失败,克里姆林宫正在考虑如何脱身

亡海中的彼岸花
2024-07-01 00:35:02
三大消息:大战已不可避免?外交部发声哀悼!菲律宾这次真闹大了

三大消息:大战已不可避免?外交部发声哀悼!菲律宾这次真闹大了

战域笔墨
2024-06-27 18:21:28
当“苦相脸”硬演女法官,高颜值被打回原形,罗晋演技再好也白搭

当“苦相脸”硬演女法官,高颜值被打回原形,罗晋演技再好也白搭

浩妈的美食
2024-06-30 07:53:41
父母最大的愚蠢,就是在这4个方面“耗尽”子女的福分

父母最大的愚蠢,就是在这4个方面“耗尽”子女的福分

四象八卦
2024-07-01 01:11:47
美媒晒布朗尼詹姆斯净资产,未进入NBA已经是千万富豪

美媒晒布朗尼詹姆斯净资产,未进入NBA已经是千万富豪

阿雄侃篮球
2024-06-30 19:12:21
新华社消息|世界气象组织:极端天气气候事件已成新常态

新华社消息|世界气象组织:极端天气气候事件已成新常态

新华社
2024-06-30 11:29:34
这次,长沙四胞胎父亲在劫难逃,身份被曝,道歉理由无法自圆其说

这次,长沙四胞胎父亲在劫难逃,身份被曝,道歉理由无法自圆其说

辣条小剧场
2024-06-28 01:39:46
武汉已封堵50座沿江闸口,武汉关水位预计7月3日超警

武汉已封堵50座沿江闸口,武汉关水位预计7月3日超警

极目新闻
2024-06-30 20:49:24
内战末期,是谁指点蒋介石退守台湾?是谁建议毛主席先夺台湾?

内战末期,是谁指点蒋介石退守台湾?是谁建议毛主席先夺台湾?

旧梦初醒已千年
2024-01-22 10:28:33
前交叉危!曝泰山队又一外援赛季报销

前交叉危!曝泰山队又一外援赛季报销

球事百科吖
2024-06-30 23:54:14
Woj:托平四年6000万留守步行者

Woj:托平四年6000万留守步行者

直播吧
2024-07-01 01:48:21
下半年想买SUV,认准这5款新车就够了

下半年想买SUV,认准这5款新车就够了

鸭梨说车
2024-06-30 12:44:47
意媒:曼联和齐尔克泽经纪人谈妥佣金,滕哈格说服球员加盟

意媒:曼联和齐尔克泽经纪人谈妥佣金,滕哈格说服球员加盟

懂球帝
2024-07-01 03:45:15
女模特私密视频意外泄露遭疯狂传播,本人崩溃痛哭,恳求不要观看

女模特私密视频意外泄露遭疯狂传播,本人崩溃痛哭,恳求不要观看

吃鱼思故渊
2024-05-17 22:00:37
2024-07-01 04:48:49
人工智能学家
人工智能学家
人工智能领域权威媒体
2927文章数 36936关注度
往期回顾 全部

科技要闻

河南火箭坠落爆炸?商业航天公司回应了

头条要闻

西班牙反超!法比安头球破门 亚马尔送传中助攻

头条要闻

西班牙反超!法比安头球破门 亚马尔送传中助攻

体育要闻

“意大利很弱”,不再是错觉了

娱乐要闻

白玉兰明星反应精彩 胡歌获奖唐嫣激动

财经要闻

A股上半年人均亏损1.2万 你亏了多少?

汽车要闻

小鹏MONA M03 7月3日首发 15万紧凑级

态度原创

旅游
手机
艺术
数码
公开课

旅游要闻

突发!上海出发豪华邮轮,男子翻越栏杆后落海

手机要闻

鸿蒙生态再添新丁!神秘5G新机通过认证,距离发布不远了

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

数码要闻

回应小米空调第一不实后!董明珠:不是我刻意要当网红 格力的产品深入人心

公开课

连中三元是哪三元?

无障碍浏览 进入关怀版