嘘~ 正在从服务器偷取页面 . . .

Interactive


⚠️ 以下所有内容总结都来自于 大语言模型的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验

2025-06-04 更新

ARFlow: Human Action-Reaction Flow Matching with Physical Guidance

Authors:Wentao Jiang, Jingya Wang, Kaiyang Ji, Baoxiong Jia, Siyuan Huang, Ye Shi

Human action-reaction synthesis, a fundamental challenge in modeling causal human interactions, plays a critical role in applications ranging from virtual reality to social robotics. While diffusion-based models have demonstrated promising performance, they exhibit two key limitations for interaction synthesis: reliance on complex noise-to-reaction generators with intricate conditional mechanisms, and frequent physical violations in generated motions. To address these issues, we propose Action-Reaction Flow Matching (ARFlow), a novel framework that establishes direct action-to-reaction mappings, eliminating the need for complex conditional mechanisms. Our approach introduces a physical guidance mechanism specifically designed for Flow Matching (FM) that effectively prevents body penetration artifacts during sampling. Moreover, we discover the bias of traditional flow matching sampling algorithm and employ a reprojection method to revise the sampling direction of FM. To further enhance the reaction diversity, we incorporate randomness into the sampling process. Extensive experiments on NTU120, Chi3D and InterHuman datasets demonstrate that ARFlow not only outperforms existing methods in terms of Fr'echet Inception Distance and motion diversity but also significantly reduces body collisions, as measured by our new Intersection Volume and Intersection Frequency metrics.

人类动作反应合成是模拟因果人类交互的一个基本挑战,在虚拟应用到现实机器人等多个领域都有着关键作用。虽然基于扩散的模型已经展现出了其应用的潜力,但它们在交互合成中表现出了两大局限性:依赖复杂的有噪声的反应生成器,带有复杂的条件机制,以及在生成的运动中频繁出现物理违规现象。为了解决这些问题,我们提出了动作反应流匹配(ARFlow)这一新型框架,建立了直接的动作到反应映射,消除了复杂条件机制的需求。我们的方法引入了一种专门为流匹配(FM)设计的物理引导机制,在采样过程中能有效防止身体穿透现象。此外,我们发现了传统流匹配采样算法的偏差,并采用了一种重新投影方法来修正FM的采样方向。为了进一步提升反应的多样性,我们在采样过程中引入了随机性。在NTU120、Chi3D和InterHuman数据集上的大量实验表明,ARFlow不仅在Fréchet Inception距离和运动多样性方面优于现有方法,而且通过我们新的交集体积和交集频率指标测量,显著减少了身体碰撞。

论文及项目相关链接

PDF Project Page: https://arflow2025.github.io/

Summary

人类动作反应合成是模拟因果人类交互的一个基本挑战,在虚拟现实和社会机器人等领域有广泛应用。尽管扩散模型表现出了一定的潜力,但它们对于互动合成存在两大关键局限:依赖于复杂的噪声到反应的生成器,带有复杂条件机制,并且在生成的运动中经常违反物理规律。为解决这些问题,我们提出了动作反应流匹配(ARFlow)这一新框架,建立直接的动作到反应的映射,无需复杂条件机制。我们的方法引入了一种针对流匹配的物理指导机制,有效防止采样时的身体穿透伪影。此外,我们发现了传统流匹配采样算法的偏差,并采用重新投影方法对FM的采样方向进行修正。为进一步提高反应多样性,我们在采样过程中引入了随机性。在NTU120、Chi3D和InterHuman数据集上的大量实验表明,ARFlow不仅在Fréchet Inception Distance和运动多样性方面优于现有方法,而且在我们的新交集体积和交集频率指标方面显著减少了身体碰撞。

Key Takeaways

  1. 人机交互领域中,人类动作反应合成是一个重要的挑战,具有广泛的应用前景。
  2. 扩散模型虽然在某些情况下表现出良好的性能,但在模拟复杂的人机交互时存在两大关键局限。
  3. ARFlow框架被提出来解决这些问题,通过直接建立动作到反应的映射,简化了复杂的条件机制。
  4. ARFlow引入了物理指导机制来防止身体穿透伪影,并修正了传统流匹配采样算法的偏差。
  5. 通过在采样过程中引入随机性,ARFlow提高了反应的多样性。
  6. 在多个数据集上的实验表明,ARFlow在多个指标上优于现有的方法。

Cool Papers

点此查看论文截图

Dialogue Systems for Emotional Support via Value Reinforcement

Authors:Juhee Kim, Chunghu Mok, Jisun Lee, Hyang Sook Kim, Yohan Jo

Emotional support dialogue systems aim to reduce help-seekers’ distress and help them overcome challenges. While human values$\unicode{x2013}$core beliefs that shape an individual’s priorities$\unicode{x2013}$are increasingly emphasized in contemporary psychological therapy for their role in fostering internal transformation and long-term emotional well-being, their integration into emotional support systems remains underexplored. To bridge this gap, we present a value-driven method for training emotional support dialogue systems designed to reinforce positive values in seekers. Notably, our model identifies which values to reinforce at each turn and how to do so, by leveraging online support conversations from Reddit. We evaluate the method across support skills, seekers’ emotional intensity, and value reinforcement. Our method consistently outperforms various baselines, effectively exploring and eliciting values from seekers. Additionally, leveraging crowd knowledge from Reddit significantly enhances its effectiveness. Therapists highlighted its ability to validate seekers’ challenges and emphasize positive aspects of their situations$\unicode{x2013}$both crucial elements of value reinforcement. Our work, being the first to integrate value reinforcement into emotional support systems, demonstrates its promise and establishes a foundation for future research.

情感支持对话系统的目标是减轻求助者的压力,帮助他们克服挑战。在当代心理治疗过程中,人的价值观越来越受到重视,这些价值观塑造了个人的优先事项,对于促进内心转变和长期情感健康有着重要作用。然而,这些价值观在情感支持系统中的应用仍然缺乏足够的探索。为了弥补这一差距,我们提出了一种以价值为导向的方法,旨在训练能够在寻求者中强化积极价值观的情感支持对话系统。值得注意的是,我们的模型通过利用Reddit上的在线支持对话来识别每次对话中需要强化的价值观以及如何强化这些价值观。我们在支持技能、求助者的情感强度和价值观强化等方面对这种方法进行了评估。该方法在各种基线测试上表现始终优于其他方法,能够有效地探索和激发求助者的价值观。此外,利用Reddit上的集体知识显著提高了其有效性。治疗师强调了该方法验证求助者挑战和强调其处境积极方面的能力——这两者都是价值观强化的关键要素。我们的工作是第一个将价值强化整合到情感支持系统中的工作,展示了其潜力并为未来的研究奠定了基础。

论文及项目相关链接

PDF This paper has been accepted for publication at ACL 2025

Summary
情感支持对话系统旨在帮助求助者减轻压力并克服挑战。当代心理治疗越来越强调人的价值观在促进内心转变和长期情感健康方面的作用,但在情感支持系统中对其的整合仍然被忽视。为了弥补这一空白,我们提出了一种以价值驱动的方法,旨在通过训练情感支持对话系统来强化求助者的积极价值观。该方法通过识别每个回合需要强化的价值观以及如何做到这一点,并利用Reddit上的在线支持对话来实现这一目标。我们的方法在支持技能、求助者情感强度和价值观强化方面进行了评估,并且效果突出。同时利用Reddit中的群众知识增强了方法的有效性。专家对此给予了高度评价,强调了其在验证求助者挑战和强调情境中的积极方面方面的能力——价值观强化的关键要素。我们的工作首次将价值观强化整合到情感支持系统中,展示了其潜力并为未来的研究奠定了基础。

Key Takeaways

  1. 情感支持对话系统旨在减少求助者的压力并帮助他们应对挑战。
  2. 人的价值观在当代心理治疗中的作用日益受到重视,但对其在情感支持系统中的整合仍缺乏研究。
  3. 提出了一种价值驱动的方法,通过训练情感支持对话系统来强化求助者的积极价值观。
  4. 该方法能够识别每个回合需要强化的价值观,并利用Reddit上的在线支持对话来实现这一目标。
  5. 评估结果显示,该方法在支持技能、情感强度和价值观强化方面表现出色。
  6. 利用Reddit中的群众知识增强了该方法的有效性。

Cool Papers

点此查看论文截图


文章作者: Kedreamix
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Kedreamix !
 上一篇
Text-to-Motion Text-to-Motion
Text-to-Motion 方向最新论文已更新,请持续关注 Update in 2025-06-04 Absolute Coordinates Make Motion Generation Easy
2025-06-04
下一篇 
TTS TTS
TTS 方向最新论文已更新,请持续关注 Update in 2025-06-04 Zero-Shot Streaming Text to Speech Synthesis with Transducer and Auto-Regressive Modeling
2025-06-04
  目录