⚠️ 以下所有内容总结都来自于 大语言模型的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验
2025-11-13 更新
T-araVLN: Translator for Agricultural Robotic Agents on Vision-and-Language Navigation
Authors:Xiaobei Zhao, Xingqi Lyu, Xiang Li
Agricultural robotic agents have been becoming powerful helpers in a wide range of agricultural tasks, however, still heavily rely on manual operation or fixed railways for movement. To address this limitation, the AgriVLN method and the A2A benchmark pioneeringly extend Vision-and-Language Navigation (VLN) to the agricultural domain, enabling agents to navigate to the target positions following the natural language instructions. AgriVLN effectively understands the simple instructions, but often misunderstands the complex ones. To bridge this gap, we propose the method of Translator for Agricultural Robotic Agents on Vision-and-Language Navigation (T-araVLN), in which the Instruction Translator module translates the original instruction to be more refined and precise. When evaluated on the A2A benchmark, our T-araVLN effectively improves Success Rate from 0.47 to 0.63 and reduces Navigation Error from 2.91m to 2.28m, demonstrating the state-of-the-art performance in the agricultural domain. Code: https://github.com/AlexTraveling/T-araVLN.
农业机器人代理已经在广泛的农业任务中成为强大的助手,然而,仍然严重依赖于手动操作或固定轨道进行移动。为了解决这一局限性,AgriVLN方法和A2A基准率先将视觉和语言导航(VLN)扩展到农业领域,使代理能够按照自然语言指令导航到目标位置。AgriVLN能够有效地理解简单指令,但常常误解复杂指令。为了弥补这一差距,我们提出了面向视觉和语言导航的农业机器人代理翻译器方法(T-araVLN),其中的指令翻译模块将原始指令翻译为更精细和精确的语言。在A2A基准测试中,我们的T-araVLN成功率为有效提高从0.47至0.63,并且导航误差从2.91米减少至2.28米,显示出农业领域的最新技术性能。代码地址:https://github.com/AlexTraveling/T-araVLN。
论文及项目相关链接
Summary
农业机器人已在多种农业任务中成为强大的助手,但它们仍严重依赖于手动操作或固定轨道移动。为解决这个问题,AgriVLN方法和A2A基准率先将视觉和语言导航(VLN)扩展到农业领域,使代理能够根据自然语言指令导航到目标位置。AgriVLN能够理解简单指令,但常常误解复杂指令。为弥补这一差距,我们提出了面向农业机器人代理的视觉和语言导航翻译方法(T-araVLN),其中的指令翻译模块将原始指令翻译为更精细和精确的指令。在A2A基准测试中,我们的T-araVLN成功将成功率从0.47提高到0.63,导航误差从2.91米减少到2.28米,展现出农业领域的最先进的性能。
Key Takeaways
- 农业机器人已成为多种农业任务的强大助手,但仍存在移动方式上的限制。
- AgriVLN方法和A2A基准测试将视觉和语言导航(VLN)技术引入农业领域。
- AgriVLN能够理解简单指令,但在处理复杂指令时存在误解的问题。
- 为解决这一问题,提出了T-araVLN方法,其中的指令翻译模块能够优化指令表达。
- T-araVLN在A2A基准测试中的成功率和导航误差均表现优异,展现了其先进性。
- 该项目代码已公开,可访问链接:公开链接。