金融界2024年12月5日消息,国家知识产权局信息显示,大众问问(北京)信息科技有限公司申请一项名为“语音分离方法、装置、设备和存储介质以及语音转写方法”的专利,公开号 CN 119068900 A,申请日期为 2023 年 6 月。
专利摘要显示,本申请涉及一种语音分离方法、装置、计算机设备和存储介质以及语音转写方法。所述方法包括:获取多通道混合语音数据;从多通道混合语音数据中分离得到单路语音数据;从单路语音数据中确定不同说话人的身份转变的时间点,根据时间点将单路语音数据分割为多个不同说话人的语音短片段;对多个不同说话人的语音短片段进行分类,得到属于同一说话人的语音短片段;对同一说话人的语音短片段进行说话人聚类处理,得到属于同一说话人的分离后语音数据。采用本方法能够提高语音分离的准确性,进而提高语音转写的准确性。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.