嘘~ 正在从服务器偷取页面 . . .

Face Swapping


⚠️ 以下所有内容总结都来自于 大语言模型的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验

2025-08-23 更新

Heatmap Regression without Soft-Argmax for Facial Landmark Detection

Authors:Chiao-An Yang, Raymond A. Yeh

Facial landmark detection is an important task in computer vision with numerous applications, such as head pose estimation, expression analysis, face swapping, etc. Heatmap regression-based methods have been widely used to achieve state-of-the-art results in this task. These methods involve computing the argmax over the heatmaps to predict a landmark. Since argmax is not differentiable, these methods use a differentiable approximation, Soft-argmax, to enable end-to-end training on deep-nets. In this work, we revisit this long-standing choice of using Soft-argmax and demonstrate that it is not the only way to achieve strong performance. Instead, we propose an alternative training objective based on the classic structured prediction framework. Empirically, our method achieves state-of-the-art performance on three facial landmark benchmarks (WFLW, COFW, and 300W), converging 2.2x faster during training while maintaining better/competitive accuracy. Our code is available here: https://github.com/ca-joe-yang/regression-without-softarg.

面部特征点检测是计算机视觉领域的一个重要任务,具有许多应用,例如头部姿态估计、表情分析、面部替换等。基于heatmap回归的方法在面部特征点检测任务中取得了最先进的成果。这些方法涉及在热图上计算argmax来预测一个特征点。由于argmax是不可微分的,这些方法使用可微分的近似方法Soft-argmax,以便在深度网络上进行端到端的训练。在这项工作中,我们重新审视了使用Soft-argmax这一长期选择,并证明它并不是实现强大性能的唯一途径。相反,我们提出了一种基于经典结构预测框架的替代训练目标。从实证上看,我们的方法在三个面部特征点基准测试(WFLW、COFW和300W)上实现了最先进的性能,在训练过程中收敛速度提高了2.2倍,同时保持了更好/有竞争力的准确性。我们的代码可以在这里找到:https://github.com/ca-joe-yang/regression-without-softarg

论文及项目相关链接

PDF

Summary

本文介绍了面部地标检测任务的重要性及其在计算机视觉领域的应用。虽然热图回归方法是该领域的先进方法之一,但它们通常使用Soft-argmax来实现端到端的深度学习训练。然而,本文提出了一种基于经典结构化预测框架的替代训练目标,并实证了在三个面部地标数据集上达到了领先水平,同时在训练过程中收敛速度提高了2.2倍,同时保持了更好的准确性。代码已公开在GitHub上。

Key Takeaways

  1. 面部地标检测在计算机视觉中非常重要,可用于头部姿态估计、表情分析、面部替换等应用。
  2. 热图回归方法在该领域已经取得了显著的成果。
  3. Soft-argmax被广泛用于实现热图方法的端到端训练。
  4. 本文提出了一种基于经典结构化预测框架的替代训练目标。
  5. 该方法在三个面部地标数据集上达到了领先水平。
  6. 该方法在训练过程中收敛速度提高了2.2倍。

Cool Papers

点此查看论文截图


文章作者: Kedreamix
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Kedreamix !
 上一篇
GAN GAN
GAN 方向最新论文已更新,请持续关注 Update in 2025-08-23 Vulnerabilities in AI-generated Image Detection The Challenge of Adversarial Attacks
2025-08-23
下一篇 
Speech Speech
Speech 方向最新论文已更新,请持续关注 Update in 2025-08-23 Any-to-any Speaker Attribute Perturbation for Asynchronous Voice Anonymization
2025-08-23
  目录