发布日期: 2025-06-26

更新日期: 2025-07-06

文章字数: 1.1k

阅读时长: 4 分

阅读次数:

⚠️ 以下所有内容总结都来自于大语言模型的能力，如有错误，仅供参考，谨慎使用
🔴 请注意：千万不要用于严肃的学术场景，只能用于论文阅读前的初筛！
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ，还请您给我们一些鼓励！⭐️ HuggingFace免费体验

2025-06-26 更新

A Global-Local Cross-Attention Network for Ultra-high Resolution Remote Sensing Image Semantic Segmentation

Authors:Chen Yi, Shan LianLei

With the rapid development of ultra-high resolution (UHR) remote sensing technology, the demand for accurate and efficient semantic segmentation has increased significantly. However, existing methods face challenges in computational efficiency and multi-scale feature fusion. To address these issues, we propose GLCANet (Global-Local Cross-Attention Network), a lightweight segmentation framework designed for UHR remote sensing imagery.GLCANet employs a dual-stream architecture to efficiently fuse global semantics and local details while minimizing GPU usage. A self-attention mechanism enhances long-range dependencies, refines global features, and preserves local details for better semantic consistency. A masked cross-attention mechanism also adaptively fuses global-local features, selectively enhancing fine-grained details while exploiting global context to improve segmentation accuracy. Experimental results show that GLCANet outperforms state-of-the-art methods regarding accuracy and computational efficiency. The model effectively processes large, high-resolution images with a small memory footprint, providing a promising solution for real-world remote sensing applications.

随着超高分辨率（UHR）遥感技术的快速发展，对精确高效的语义分割的需求显著增加。然而，现有方法在计算效率和多尺度特征融合方面面临挑战。为了解决这些问题，我们提出了GLCANet（全局-局部交叉注意力网络），这是一个为超高分辨率遥感影像设计的轻量化分割框架。GLCANet采用双流架构，旨在高效融合全局语义和局部细节，同时最小化GPU的使用。自注意力机制增强了长程依赖性，细化了全局特征，并保留了局部细节，以实现更好的语义一致性。掩模交叉注意力机制也自适应地融合全局-局部特征，有选择地突出细节，同时利用全局上下文信息来提高分割精度。实验结果表明，GLCANet在精度和计算效率方面优于最新方法。该模型能够在较小的内存占用下处理大型高分辨率图像，为现实世界遥感应用提供了有前景的解决方案。

论文及项目相关链接

PDF

摘要
随着超高分辨率（UHR）遥感技术的快速发展，对准确高效的语义分割需求显著增加。然而，现有方法在计算效率和多尺度特征融合方面面临挑战。为解决这些问题，我们提出了GLCANet（全局-局部交叉注意力网络），这是一个为超高分辨率遥感图像设计的轻量级分割框架。GLCANet采用双流架构，能够高效融合全局语义和局部细节，同时最小化GPU使用。自注意力机制增强了远程依赖性，细化了全局特征，并保留了局部细节，以实现更好的语义一致性。掩码交叉注意力机制还自适应地融合全局局部特征，有选择地突出细节，并利用全局上下文提高分割精度。实验结果表明，GLCANet在精度和计算效率方面优于最新方法。该模型能够在内存占用较小的情况下处理大型高分辨率图像，为现实世界遥感应用提供了有前景的解决方案。

要点