【论文笔记】Leveraging Datasets with Varying Annotations for Face Alignment via Deep Regression Network

本文介绍了ICCV2015年的一篇论文,提出了利用深度回归网络(DRN)和稀疏形状回归(SSR)方法,通过整合不同人脸关键点数据集,实现统一的关键点检测模型。该模型能够合并不同点数的数据集,提高检测精度,并在实验中展示了与单个训练集相比的性能提升。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

参考文献:

Zhang J, Kan M, Shan S, et al. Leveraging Datasets With Varying Annotations for Face Alignment via Deep Regression Network[C]//Proceedings of the IEEE International Conference on Computer Vision. 2015: 3801-3809.

简介

目前网上公布的人脸关键点的数据集很多,但标注标准却往往不统一、标定点数也不尽相同。将这些数据合并起来非常重要,但是训练一个统一的模型却比较困难。ICCV 2015的这篇文章提出了一种基于深度回归网络(deep regression network)和稀疏形状回归方法,能够在不同点数的数据集上训练一个统一的关键点检测模型,同时能够取得比单个训练集更好的结果。

算法介绍

1. 算法总流程

算法流程如图所示:

算法流程图

假设有若干不同点数、不同图片的人脸关键点数据集,(1)H 表示稀疏形状回归模型,它能将估计每个数据集中相对于所有数据集关键点类型总和的未标注的关键点; (2)将每个数据集的关键点个数通过 H 补齐后, F 表示深度回归网络,训练和检测图片中所有的关键点的检测模型。(1)(2)过程是一个反复迭代更新的过程。通过这样的一个训练过程,就能训练一个能够合并所有不同数据集的人脸关键点检测模型。

假设有 n 个人脸关键点数据集{D1,D2,...,Dn},每个数据集包含了不同点数pi的关键点 SiRpi×2。作者目标是建立一个深度回归网络 F,可以检测所有关键点类型的合集 S=S1S2...Sn。这样就需要根据ground truth和初始化形状 S¯,求解满足以下公式的 F:

F=argmin FID||S(F(ϕ(I,S¯))+S¯)||22

其中 I 为数据集D D 中的人脸图片,ϕ 为特征提取函数。

数据集 Di 只有第 i类型的关键点,其它类型的关键点并不存在。但是可以根据不同类型关键点之间的相关性,使用其它数据集的关键点来估计当前数据集的关键点。作者使用了稀疏表达模型 H 来估计这些并不存在的关键点,因此以上公式就演变为:

{F,H}=argminFID||SH(I)(F(ϕ(I,S¯))+S¯)||22

IDi时,Hi 种类型的关键点是已经标注好的,而其它 n1 种类型的关键点则使用 H 估计生成。

2. 方法流程细节
2.1 深度回归模型

与 SDM/LBF类似,作者也使用了回归方法训练和测试图像特征到关键点位置的映射,区别是使用深度回归网络从初始形状开始回归 (深度学习已经占领各领域,不能被落下呀):

ΔS=F(I)=(fl(fl1(...f1(ϕ(I,S¯)))))

其中 fl 为深度回归网络的第l 层隐层。

2.2 稀疏回归模型

虽然各个数据集 Di的关键点定义并不相同,但是之间有着很强的关联,作者使用了稀疏矩阵根据其它数据集的关键点类型来估计当前数据集上未标记的关键点, H=[Sˆ1;Sˆ2;;Sˆi1;Si;Sˆi+1;;Sˆn]Rp×2

Sjˆ=HijSi

其中 HijRpj×pi是 一个 估计 Di 数据集中未标记的关键点 Sj^Rpj×2 的稀疏矩阵。

这样总流程的公式,可以写为另一种形式:

{F,H}=argminF,Hni=1IDi||HiSi(I)(F(ϕ(I,S¯))+S¯)||22

2.3 训练模型

上述公式有两个模型参数需要训练,作者采用了固定一个参数,训练另一个的迭代循环直到收敛的方法来求最优解。

每次迭代过程,作者采用了 L-BFGS 方法 (On optimization methods for deep learning,这个以后细看)解决。

与以往算法的不同

(1)“Collaborative facial landmark localization for transferring annotations across datasets”论文中提到的算法,需要根据训练集和测试集所有图片的关系估计映射关系,再对测试集所有图片进行关键点检测,而且训练过程中,也是针对各个数据集分别训练不同的模型。而本论文算法是将所有的数据集整合进行统一关键点数模型的训练,最终得到一个检测模型,能够方便地对一张图片进行单独检测。

(2)“Transferring landmark annotations for cross-dataset face alignment”论文中的算法 transductive alignment method (TCR)需要不同数据集的关键点的交集作为相互关联,而且在估计未标记的关键点之后,不会再有更新。而本文则不需要关键点的交集作为关联,而且在模型参数训练的过程中,估计的关键点在每次迭代过程中都会随着模型的变化而更新,因而也更加准确。

实验结果

1、作者将不同的数据集相整合进行模型训练,比基于不同的训练集单独训练的模型的精度有所提高,但比真实的数据略差些(这也在情理之中):
这里写图片描述

2、作者将DRN和SSR方法相结合,进一步提高了DRN的准确率:
这里写图片描述

3、作者又将DRN-SSR与之前的SDM、RCPR进行了比较,实验结果均优于这些算法:
这里写图片描述

总结

作者通过 DRN和SSR将多类人脸关键点数据融合,取得了比单个数据集训练模型更好的结果,最终的模型也较为实用(可为我所用,毕竟手头数据多,怎样整合一直比较头疼)。

PS

前一段时间由于操作失误,将这篇博客不小心删除(同时小吐槽下csdn的博客设置)。我这里没有备份,准备重写时无意发现网络上有人转载了我这篇文章(当然没有写明出处,公式也是乱码),我就拿过来回笼了一篇。这也算是盗版给原作者的贡献了,哈哈。

### 增强的点集查询用于矢量化地图构建的技术与算法 在地理信息系统(GIS)和制图学中,增强的点集查询对于矢量化地图构建至关重要。通过高效处理大量空间数据并提取有意义的信息,可以显著提高地图制作的质量和效率。 #### 数据预处理阶段 为了优化后续操作,在开始之前通常会对原始点云数据执行一系列预处理步骤。这包括但不限于去噪、滤波以及去除异常值等过程[^1]。这些措施有助于减少不必要的计算开销,并提升最终结果的准确性。 #### 特征检测方法 特征检测是从复杂场景中识别出具有代表性的几何元素的关键技术之一。常用的方法有: - **基于距离度量的选择**:根据相邻两点之间的欧氏距离来判断其是否属于同一对象的一部分。 - **局部密度估计**:评估每个采样位置周围的点分布情况,从而区分不同类型的地形地貌特性。 - **方向直方图分析**:统计各个方位角范围内存在的点数比例关系,进而推断可能的道路走向或其他线状实体的方向属性。 上述三种方式均能有效地辅助完成对离散化后的现实世界的抽象表示工作,为下一步骤奠定了坚实的基础。 #### 轮廓跟踪策略 当已经获取到足够的边界指示信息之后,则可以通过轮廓追踪的方式进一步细化目标区域内的结构细节。具体实现手段如下所示: - **最短路径优先遍历法**:沿着由近至远的原则依次连接起那些彼此间联系最为紧密的一系列节点,形成闭合环路或开放曲线段落; - **分水岭变换应用**:模拟水流汇聚现象,自动划分出相互独立而又互不重叠的地形单元体; - **Ramer-Douglas-Peucker简化算法调用**:针对冗余程度较高的折线序列实施降维压缩处理,保留主要转折处的同时降低整体存储需求。 以上提到的各种技巧共同作用下能够很好地满足实际应用场景下的精度要求,同时也兼顾到了运算速度方面的考量因素。 ```python import numpy as np from scipy.spatial import KDTree def enhanced_point_query(points, query_point, radius=0.5): tree = KDTree(points) indices = tree.query_ball_point(query_point, r=radius) return points[indices] points_data = np.random.rand(100, 2)*100 query_result = enhanced_point_query(points_data, (50, 50)) print(f"Query Result Points:\n{query_result}") ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值