⚠️ 以下所有内容总结都来自于 大语言模型的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验
2025-10-21 更新
MotionScript: Natural Language Descriptions for Expressive 3D Human Motions
Authors:Payam Jome Yazdian, Rachel Lagasse, Hamid Mohammadi, Eric Liu, Li Cheng, Angelica Lim
We introduce MotionScript, a novel framework for generating highly detailed, natural language descriptions of 3D human motions. Unlike existing motion datasets that rely on broad action labels or generic captions, MotionScript provides fine-grained, structured descriptions that capture the full complexity of human movement including expressive actions (e.g., emotions, stylistic walking) and interactions beyond standard motion capture datasets. MotionScript serves as both a descriptive tool and a training resource for text-to-motion models, enabling the synthesis of highly realistic and diverse human motions from text. By augmenting motion datasets with MotionScript captions, we demonstrate significant improvements in out-of-distribution motion generation, allowing large language models (LLMs) to generate motions that extend beyond existing data. Additionally, MotionScript opens new applications in animation, virtual human simulation, and robotics, providing an interpretable bridge between intuitive descriptions and motion synthesis. To the best of our knowledge, this is the first attempt to systematically translate 3D motion into structured natural language without requiring training data.
我们介绍了MotionScript,这是一个生成关于3D人体运动高度详细、自然语言描述的新型框架。与现有的依赖广泛动作标签或通用标题的运动数据集不同,MotionScript提供精细结构化描述,捕捉人类运动的全部复杂性,包括表达性动作(例如情绪、风格化行走)以及超出标准运动捕获数据集之外的交互。MotionScript既可作为描述工具,也可作为文本到运动模型的训练资源,能够实现从文本合成高度逼真、多样化的运动。通过为运动数据集增加MotionScript标题,我们显示出在超出分布的运动生成方面的巨大改进,使大型语言模型能够生成超出现有数据的运动。此外,MotionScript在动画、虚拟人类仿真和机器人技术等领域开启了新应用,提供了一个直观桥梁,用于将直观描述和运动合成结合起来。据我们所知,这是首次尝试系统性地将3D运动转换为结构化自然语言,而无需训练数据。
论文及项目相关链接
PDF Project webpage: https://pjyazdian.github.io/MotionScript
Summary
MotionScript是一种新型框架,用于生成关于3D人类运动的详细自然语言描述。它不同于依赖广泛动作标签或通用标题的现有运动数据集,MotionScript提供精细结构化的描述,捕捉人类运动的全部复杂性,包括表现性动作和超出标准运动捕捉数据集之外的交互。MotionScript既可作为描述工具,也可作为文本到运动模型的训练资源,使从文本合成的运动和人类动作更加逼真和多样化。通过为运动数据集增加MotionScript标题,我们展示了在超出分布的运动生成方面的显着改进,使大型语言模型能够生成超出现有数据的运动。此外,MotionScript在动画、虚拟人类模拟和机器人技术等领域开启了新的应用,提供了直观描述和运动合成之间的桥梁。这是首次尝试将3D运动系统地翻译成结构化自然语言,而无需训练数据。
Key Takeaways
- MotionScript是一个生成关于3D人类运动的详细自然语言描述的框架。
- 它提供精细结构化的描述,捕捉人类运动的全部复杂性。
- MotionScript能描述表现性动作和超出标准运动捕捉数据集的交互。
- 作为描述工具和训练资源,MotionScript能合成高度逼真和多样化的运动和人类动作。
- 通过增加MotionScript标题,运动数据集在超出分布的运动生成方面得到显着改进。
- 大型语言模型(LLMs)可以生成超出现有数据的运动。
点此查看论文截图




