⚠️ 以下所有内容总结都来自于 大语言模型的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验
2025-11-12 更新
Lesion-Aware Post-Training of Latent Diffusion Models for Synthesizing Diffusion MRI from CT Perfusion
Authors:Junhyeok Lee, Hyunwoong Kim, Hyungjin Chung, Heeseong Eom, Joon Jang, Chul-Ho Sohn, Kyu Sung Choi
Image-to-Image translation models can help mitigate various challenges inherent to medical image acquisition. Latent diffusion models (LDMs) leverage efficient learning in compressed latent space and constitute the core of state-of-the-art generative image models. However, this efficiency comes with a trade-off, potentially compromising crucial pixel-level detail essential for high-fidelity medical images. This limitation becomes particularly critical when generating clinically significant structures, such as lesions, which often occupy only a small portion of the image. Failure to accurately reconstruct these regions can severely impact diagnostic reliability and clinical decision-making. To overcome this limitation, we propose a novel post-training framework for LDMs in medical image-to-image translation by incorporating lesion-aware medical pixel space objectives. This approach is essential, as it not only enhances overall image quality but also improves the precision of lesion delineation. We evaluate our framework on brain CT-to-MRI translation in acute ischemic stroke patients, where early and accurate diagnosis is critical for optimal treatment selection and improved patient outcomes. While diffusion MRI is the gold standard for stroke diagnosis, its clinical utility is often constrained by high costs and low accessibility. Using a dataset of 817 patients, we demonstrate that our framework improves overall image quality and enhances lesion delineation when synthesizing DWI and ADC images from CT perfusion scans, outperforming existing image-to-image translation models. Furthermore, our post-training strategy is easily adaptable to pre-trained LDMs and exhibits substantial potential for broader applications across diverse medical image translation tasks.
图像到图像的翻译模型有助于缓解医学图像采集过程中存在的各种挑战。潜在扩散模型(LDMs)在压缩的潜在空间中实现了高效学习,构成了当前最先进的生成图像模型的核心。然而,这种效率是有代价的,可能会损害对高保真医学图像至关重要的像素级细节。当生成临床上重要的结构(如仅占图像一小部分的病变)时,这种限制变得尤为关键。无法准确重建这些区域会严重影响诊断的可靠性和临床决策。为了克服这一局限性,我们提出了一种新的针对医学图像到图像翻译中LDM的后训练框架,该框架通过融入病变感知医学像素空间目标来解决这个问题。这种方法至关重要,因为它不仅提高了整体图像质量,还提高了病变勾勒的精度。我们在急性缺血性卒中患者的脑部CT到MRI翻译任务上评估了我们的框架,早期和准确的诊断对于选择最佳治疗方案和改善患者预后至关重要。尽管扩散MRI是卒中诊断的金标准,但其临床应用往往受到成本高和可及性低的限制。我们使用包含817名患者的数据集展示了我们的框架在合成DWI和ADC图像时的效果,这些图像是从CT灌注扫描中生成的,我们的框架在图像到图像的翻译模型上表现更好,提高了图像的整体质量和病变勾勒的准确性。此外,我们的后训练策略很容易适应预训练的LDM,并在各种医学图像翻译任务中具有广泛的应用潜力。
论文及项目相关链接
PDF MICCAI 2025, Lecture Notes in Computer Science Vol. 15961
摘要
基于图像到图像的转换模型可以缓解医疗图像采集中的各种固有挑战。潜在扩散模型(LDM)利用压缩潜在空间中的高效学习,构成了当前先进的生成图像模型的核心。然而,这种效率是有代价的,可能会损害对高质量医疗图像至关重要的像素级细节。当生成临床上重要的结构(如病变)时,这种局限性变得尤为重要。病变通常只占图像的一小部分,如果不能准确重建这些区域,将严重影响诊断的可靠性和临床决策。为了克服这一局限性,我们提出了一种针对医疗图像到图像转换的潜在扩散模型的新型后训练框架,通过引入病变感知医疗像素空间目标来解决这个问题。我们不仅提高了整体图像质量,而且提高了病变勾画的精度。我们对急性缺血性卒中患者的脑部CT到MRI转换进行了评估,早期和准确的诊断对于选择最佳治疗方案和改善患者预后至关重要。虽然扩散MRI是卒中诊断的金标准,但其临床应用往往受到成本高和可及性低的限制。我们使用包含817名患者的数据集展示了我们的框架在合成DWI和ADC图像从CT灌注扫描中的优势,在图像到图像转换模型中表现优异。此外,我们的后训练策略可以轻松适应预训练的LDM,并在各种医疗图像翻译任务中具有广泛的应用潜力。
关键见解
- 潜在扩散模型(LDMs)是医疗图像转换领域先进生成图像模型的核心。
- LDM在压缩潜在空间中的高效学习可能会损害关键的像素级细节,这对医疗图像至关重要。
- 在生成临床重要结构(如病变)时,LDM的局限性尤为突出。
- 提出了一种新型后训练框架,通过引入病变感知医疗像素空间目标来解决LDM在医疗图像转换中的局限性。
- 在急性缺血性卒中患者的脑部CT到MRI转换中评估了新框架的性能,显示出提高图像质量和病变勾画精度的能力。
- 与现有图像到图像翻译模型相比,新框架在合成DWI和ADC图像从CT灌注扫描中表现出优势。
点此查看论文截图