嘘~ 正在从服务器偷取页面 . . .

Text-to-Motion


⚠️ 以下所有内容总结都来自于 大语言模型的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验

2025-03-15 更新

MotionScript: Natural Language Descriptions for Expressive 3D Human Motions

Authors:Payam Jome Yazdian, Rachel Lagasse, Hamid Mohammadi, Eric Liu, Li Cheng, Angelica Lim

We introduce MotionScript, a novel framework for generating highly detailed, natural language descriptions of 3D human motions. Unlike existing motion datasets that rely on broad action labels or generic captions, MotionScript provides fine-grained, structured descriptions that capture the full complexity of human movement including expressive actions (e.g., emotions, stylistic walking) and interactions beyond standard motion capture datasets. MotionScript serves as both a descriptive tool and a training resource for text-to-motion models, enabling the synthesis of highly realistic and diverse human motions from text. By augmenting motion datasets with MotionScript captions, we demonstrate significant improvements in out-of-distribution motion generation, allowing large language models (LLMs) to generate motions that extend beyond existing data. Additionally, MotionScript opens new applications in animation, virtual human simulation, and robotics, providing an interpretable bridge between intuitive descriptions and motion synthesis. To the best of our knowledge, this is the first attempt to systematically translate 3D motion into structured natural language without requiring training data.

我们介绍了MotionScript,这是一个生成关于3D人体运动高度详细、自然语言描述的新型框架。不同于依赖广泛动作标签或通用标题的现有运动数据集,MotionScript提供精细的、结构化的描述,捕捉人类运动的全部复杂性,包括表现性动作(例如情绪、风格化的行走)以及超出标准运动捕获数据集之外的交互。MotionScript既可作为描述工具,也可作为文本到运动模型的训练资源,能够实现从文本合成高度逼真和多样化的运动。通过为运动数据集增加MotionScript标题,我们展示了在超出分布的运动生成方面的显著改进,使大型语言模型(LLM)能够生成超出现有数据的运动。此外,MotionScript在动画、虚拟人类仿真和机器人技术等领域开启了新的应用,提供了直观描述和运动合成之间的可解释桥梁。据我们所知,这是首次尝试系统地以自然语言形式将三维运动转化为结构化形式,而无需训练数据支持。

论文及项目相关链接

PDF Project webpage: https://pjyazdian.github.io/MotionScript

Summary
MotionScript是一种新型框架,用于生成关于3D人类运动的详细自然语言描述。它不同于依赖广泛动作标签或通用标题的现有运动数据集,MotionScript提供精细结构化的描述,捕捉人类运动的全部复杂性,包括表达性动作(如情绪、风格化的行走)和超出标准运动捕获数据集的交互。MotionScript既可作为描述工具,也可作为文本到运动模型的训练资源,使从文本合成的现实高度逼真和多样化的运动成为可能。通过增强运动数据集与MotionScript标题,我们展示了在超出分布的运动生成方面的显著改进,使大型语言模型能够生成超出现有数据的运动。此外,MotionScript还为动画、虚拟人物仿真和机器人技术打开了新的应用领域,提供了一种直观易懂的语言与动作合成之间的桥梁。它是首次系统性地将三维动作转化为结构化的自然语言,无需训练数据。

Key Takeaways

  1. MotionScript是一个新型框架,用于生成关于3D人类运动的详细自然语言描述。
  2. 与现有运动数据集不同,MotionScript提供精细结构化的描述,捕捉人类运动的复杂性。
  3. MotionScript既可作为描述工具,也可作为训练资源,用于从文本合成高度逼真的运动。
  4. 通过增强运动数据集与MotionScript标题,显著改进了超出分布的运动生成能力。
  5. 大型语言模型(LLMs)能够利用MotionScript生成超出现有数据的运动。
  6. MotionScript为动画、虚拟人物仿真和机器人技术打开了新的应用领域。

Cool Papers

点此查看论文截图


文章作者: Kedreamix
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Kedreamix !
 上一篇
R1_Reasoning R1_Reasoning
R1_Reasoning 方向最新论文已更新,请持续关注 Update in 2025-03-16 GoT Unleashing Reasoning Capability of Multimodal Large Language Model for Visual Generation and Editing
2025-03-16
下一篇 
Talking Head Generation Talking Head Generation
Talking Head Generation 方向最新论文已更新,请持续关注 Update in 2025-03-15 StyleSpeaker Audio-Enhanced Fine-Grained Style Modeling for Speech-Driven 3D Facial Animation
  目录