嘘~ 正在从服务器偷取页面 . . .

人脸相关


⚠️ 以下所有内容总结都来自于 大语言模型的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验

2025-09-13 更新

FPI-Det: a face–phone Interaction Dataset for phone-use detection and understanding

Authors:Jianqin Gao, Tianqi Wang, Yu Zhang, Yishu Zhang, Chenyuan Wang, Allan Dong, Zihao Wang

The widespread use of mobile devices has created new challenges for vision systems in safety monitoring, workplace productivity assessment, and attention management. Detecting whether a person is using a phone requires not only object recognition but also an understanding of behavioral context, which involves reasoning about the relationship between faces, hands, and devices under diverse conditions. Existing generic benchmarks do not fully capture such fine-grained human–device interactions. To address this gap, we introduce the FPI-Det, containing 22{,}879 images with synchronized annotations for faces and phones across workplace, education, transportation, and public scenarios. The dataset features extreme scale variation, frequent occlusions, and varied capture conditions. We evaluate representative YOLO and DETR detectors, providing baseline results and an analysis of performance across object sizes, occlusion levels, and environments. Source code and dataset is available at https://github.com/KvCgRv/FPI-Det.

移动设备的广泛使用给安全监控、工作场所生产力评估和注意力管理中的视觉系统带来了新的挑战。检测一个人是否在使用手机不仅需要进行对象识别,还需要理解行为上下文,这涉及到在不同条件下对面部、双手和设备之间关系的推理。现有的通用基准测试并未完全涵盖此类精细粒度的人与设备交互。为了弥补这一空白,我们引入了FPI-Det数据集,其中包含22,879张图像,对工作场所、教育、交通和公共场景中的面部和手机进行了同步标注。该数据集具有极端尺度变化、频繁遮挡和多变采集条件等特点。我们对YOLO和DETR检测器进行了评估,提供了基线结果以及对不同对象大小、遮挡级别和环境性能的分析。数据集和源代码可在https://github.com/KvCgRv/FPI-Det获取。

论文及项目相关链接

PDF

Summary

移动设备的广泛使用给安全监控、工作场所生产力评估和注意力管理等领域中的视觉系统带来了新的挑战。为了检测人们是否使用手机,不仅需要识别物体,还需要理解行为上下文,这涉及到在不同条件下对面部、手部和设备之间关系的推理。现有的通用基准测试未能充分捕捉这种精细粒度的手机与人的互动。为解决这一空白,我们推出了FPI-Det数据集,包含22,879张图像,对职场、教育、交通和公共场景中的面部和电话进行了同步标注。该数据集具有极端尺度变化、频繁遮挡和多变采集条件等特点。我们对YOLO和DETR检测器进行了评估,提供了基线结果并分析了不同目标大小、遮挡程度和环境下的性能表现。数据集和源代码可在https://github.com/KvCgRv/FPI-Det获取。

Key Takeaways

  1. 移动设备的广泛使用对安全监控等领域的视觉系统带来了新的挑战。
  2. 检测使用手机的行为需要识别物体并理解行为上下文。
  3. 现有通用基准测试未能充分捕捉手机与人的精细粒度的互动。
  4. FPI-Det数据集包含同步标注的面部和电话图像,适用于多种场景。
  5. FPI-Det数据集具有极端尺度变化、频繁遮挡和多变采集条件等特点。
  6. 研究人员评估了YOLO和DETR检测器的性能。

Cool Papers

点此查看论文截图


文章作者: Kedreamix
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Kedreamix !
  目录