金融界2024年12月2日消息,国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“图像边框识别模型训练方法及装置、电子设备和介质”的专利,公开号 CN 119048815 A,申请日期为 2024年8月。
专利摘要显示,本公开提供了一种图像边框识别模型训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及人工智能领域,尤其涉及深度学习、图像识别、信息推荐技术领域。实现方案为:获取待识别的图像,用于在多个分类子任务下进行边框识别;将待识别的图像输入主干网络以获得第一图像特征;对于每个分类子任务,执行以下操作:将第一图像特征输入该分类子任务所对应的全连接层获得第一特征向量;将该分类子任务对应的第一特征向量作为关键向量和数值向量、至少一个其他分类子任务对应的第一特征向量作为查询向量输入该分类子任务对应的多头注意力模块,获得在该分类子任务下待识别的图像的边框信息属于各个类别的概率,以基于概率确定边框信息。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.