一、引言
在本文中,我们将深入探讨 Meta AI 的一项新成果,该成果发表于一篇题为《Sapiens:人类视觉模型的基础》的研究论文中。这篇论文介绍了一系列模型,这些模型针对四项以人类为中心的基本任务,正如我们在上面的演示中看到的那样。
二、以人类为中心的基本任务
在论文的上图中,我们可以了解到Sapiens所针对的任务。
- 姿态估计:检测输入图像中人体关键点的位置。
- 身体部位分割:确定哪些像素构成不同的身体部位。
- 深度估计:确定像素的深度。如“深度”列中的示例所示,图像前面的部分更亮,图像后面的像素更暗。
- 表面法线估计:提供物体(在我们的案例中是人体)形状的方向信息。
令人印象深刻的是,与之前的最先进结果相比,Meta AI 在所有这些任务上都取得了显著改进。在本文的其余部分,我们将解释 Meta AI 的研究人员是如何创建这些模型的。