嘘~ 正在从服务器偷取页面 . . .

牙齿修复


⚠️ 以下所有内容总结都来自于 大语言模型的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验

2025-11-11 更新

A benchmark multimodal oro-dental dataset for large vision-language models

Authors:Haoxin Lv, Ijazul Haq, Jin Du, Jiaxin Ma, Binnian Zhu, Xiaobing Dang, Chaoan Liang, Ruxu Du, Yingjie Zhang, Muhammad Saqib

The advancement of artificial intelligence in oral healthcare relies on the availability of large-scale multimodal datasets that capture the complexity of clinical practice. In this paper, we present a comprehensive multimodal dataset, comprising 8775 dental checkups from 4800 patients collected over eight years (2018-2025), with patients ranging from 10 to 90 years of age. The dataset includes 50000 intraoral images, 8056 radiographs, and detailed textual records, including diagnoses, treatment plans, and follow-up notes. The data were collected under standard ethical guidelines and annotated for benchmarking. To demonstrate its utility, we fine-tuned state-of-the-art large vision-language models, Qwen-VL 3B and 7B, and evaluated them on two tasks: classification of six oro-dental anomalies and generation of complete diagnostic reports from multimodal inputs. We compared the fine-tuned models with their base counterparts and GPT-4o. The fine-tuned models achieved substantial gains over these baselines, validating the dataset and underscoring its effectiveness in advancing AI-driven oro-dental healthcare solutions. The dataset is publicly available, providing an essential resource for future research in AI dentistry.

人工智能在口腔健康护理领域的进步依赖于能够捕捉临床实践复杂性的大规模多模式数据集的可用性。在本文中,我们展示了一个全面的多模式数据集,该数据集包含来自4800名患者的8775次牙科检查记录,这些记录是在八年(2018年至2025年)的时间里收集的,患者年龄介于10岁至90岁之间。数据集包括5万张口腔内图像、8056张放射线图像以及详细的文字记录,包括诊断结果、治疗计划和随访记录。这些数据是在标准的道德准则的指导下收集的,并进行注释以供基准测试。为了证明其效用,我们对最先进的视觉语言模型Qwen-VL 3B和7B进行了微调,并在两个任务上对其进行了评估:对六种口腔牙齿异常进行分类以及从多模式输入中生成完整的诊断报告。我们将经过微调后的模型与基线模型和GPT-4o进行了比较。经过微调后的模型在这些基线模型上取得了实质性的进展,验证了数据集的有效性,并强调了其在推动人工智能驱动的口腔牙齿健康护理解决方案方面的有效性。该数据集公开可用,是未来人工智能牙科研究的重要资源。

论文及项目相关链接

PDF

Summary

本文介绍了一个包含8775次牙科检查的大型多模式数据集,涵盖了来自4800名患者的诊断、治疗计划和随访记录等信息。数据集可用于训练人工智能模型,以改善口腔健康护理。通过对先进的视觉语言模型进行微调并评估,证明了数据集的有效性和价值。该数据集已公开发布,为未来的牙科人工智能研究提供了重要资源。

Key Takeaways

  1. 介绍了包含8775次牙科检查的大型多模式数据集,涵盖多种数据类型,如口腔内图像、放射影像和详细文字记录等。
  2. 数据集包含来自不同年龄段的患者的信息,有助于研究口腔健康在不同年龄群体中的差异。
  3. 数据集遵循标准伦理准则进行收集并进行了标注,以供基准测试使用。
  4. 使用先进视觉语言模型进行微调,并评估其在口腔异常分类和诊断报告生成方面的性能。
  5. 相比基线模型,微调后的模型取得了显著的提升,证明了数据集的有效性和价值。
  6. 数据集公开发布,为未来的牙科人工智能研究提供了重要资源。

Cool Papers

点此查看论文截图


文章作者: Kedreamix
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Kedreamix !
  目录