金融界2024年12月21日消息,国家知识产权局信息显示,歌尔科技有限公司申请一项名为“远场拾音方法、装置、设备及介质”的专利,公开号CN 119152873 A,申请日期为2023年6月。
专利摘要显示,本申请公开了一种远场拾音方法、装置、设备及介质,属于远场拾音技术领域。本申请聚焦提升远距离拾音质量,提升语音识别或翻译效果,提出一种远场拾音方法的技术方案,首先,在确定需要对获取到的原始音频进行音频处理之后,定位原始音频的声源位置,并基于声源位置和采集原始音频的麦克风位置生成音频波束;然后,在确定音频波束存在高噪之后,对音频波束进行噪声抑制,从而输出目标音频。基于麦克风阵列的信号处理技术,自动估计目标说话人方位,主波束聚焦说话人方向并抑制其他干扰,并通过降噪模块进一步消除噪声,提升语音清晰度。以此,识别风噪、高噪、安静或小噪声场景以进行不同的音效处理,更为细致地提升不同场景下的语音识别正确率。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.