⚠️ 以下所有内容总结都来自于 大语言模型的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验
2025-07-12 更新
Toward Real-World Chinese Psychological Support Dialogues: CPsDD Dataset and a Co-Evolving Multi-Agent System
Authors:Yuanchen Shi, Longyin Zhang, Fang Kong
The growing need for psychological support due to increasing pressures has exposed the scarcity of relevant datasets, particularly in non-English languages. To address this, we propose a framework that leverages limited real-world data and expert knowledge to fine-tune two large language models: Dialog Generator and Dialog Modifier. The Generator creates large-scale psychological counseling dialogues based on predefined paths, which guide system response strategies and user interactions, forming the basis for effective support. The Modifier refines these dialogues to align with real-world data quality. Through both automated and manual review, we construct the Chinese Psychological support Dialogue Dataset (CPsDD), containing 68K dialogues across 13 groups, 16 psychological problems, 13 causes, and 12 support focuses. Additionally, we introduce the Comprehensive Agent Dialogue Support System (CADSS), where a Profiler analyzes user characteristics, a Summarizer condenses dialogue history, a Planner selects strategies, and a Supporter generates empathetic responses. The experimental results of the Strategy Prediction and Emotional Support Conversation (ESC) tasks demonstrate that CADSS achieves state-of-the-art performance on both CPsDD and ESConv datasets.
随着压力的不断增加,对心理支持的需求日益增长,这暴露出了相关数据集,特别是在非英语语境下的数据集的稀缺性。为了解决这一问题,我们提出了一个利用有限现实世界数据和专业知识对两个大型语言模型进行微调的框架:对话生成器和对话修饰器。生成器基于预定义路径创建大规模心理咨询对话,引导系统响应策略和用户交互,为有效支持奠定基础。修饰器则对这些对话进行改进,以符合现实世界中数据的质量。通过自动和手动审查,我们构建了中文心理支持对话数据集(CPsDD),包含6.8万条对话记录,涵盖13组、16个心理问题、13个原因和12个支持重点。此外,我们还推出了全面的代理对话支持系统(CADSS),其中包括分析用户特征的分析仪、压缩对话历史的摘要器、选择策略的计划器以及生成富有同情心的回应的支持者。在策略预测和情感支持对话(ESC)任务上的实验结果表明,CADSS在CPsDD和ESConv数据集上的表现均达到了最先进的水平。
论文及项目相关链接
PDF 10pages,8 figures
Summary
心理支持需求随着压力增大而日益增长,相关数据集匮乏的问题日益凸显,特别是在非英语领域。本研究提出一个框架,利用有限现实数据和专业知识微调两个大型语言模型:对话生成器和对话修饰器。生成器基于预设路径创建大规模心理咨询对话,引导系统响应策略和用户互动,为有效支持打下基础。修饰器则使这些对话与真实数据质量相符。通过自动和手动审查,我们构建了中文心理支持对话数据集(CPsDD),包含6.8万条对话,涉及13组、16个心理问题、13个原因和12个支持重点。此外,我们引入了综合代理对话支持系统(CADSS),包括分析用户特性的分析器、精简对话历史的总结器、选择策略的计划器和生成同情回应的支持者。实验结果显示,CADSS在CPsDD和ESConv数据集上的策略预测和情感支持对话任务上达到了最新技术水平。
Key Takeaways
- 随着压力增大,心理支持需求增长,非英语领域的心理数据集匮乏。
- 提出利用有限现实数据和专业知识微调语言模型的框架。
- 对话生成器基于预设路径创建心理咨询对话。
- 对话修饰器使对话与真实数据质量相符。
- 构建了中文心理支持对话数据集(CPsDD),包含多方面数据。
- 引入综合代理对话支持系统(CADSS),包括多个组件以提供全面支持。
点此查看论文截图






