Sapiens 是由 Meta Reality Labs 开发的一系列模型,旨在解决四个基本的以人为中心的视觉任务:2D 姿态估计、身体部位分割、深度估计和表面法线预测。这些模型支持 1K 高分辨率推理,并且设计得非常灵活,可以通过对超过 3 亿张野外人体图像预训练的模型进行简单的微调来适应单独的任务。即使在标记数据稀缺或完全合成的情况下,这些模型也展现出对野外数据的显著泛化能力。随着模型参数从 0.3 到 20 亿的扩展,性能在各个任务上都有所提升。Sapiens 在多种以人为中心的基准测试中都超越了现有的基线模型。地址: 网页链接 林亦LYi的微博视频
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.