嘘~ 正在从服务器偷取页面 . . .

Interactive


⚠️ 以下所有内容总结都来自于 大语言模型的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验

2025-09-17 更新

MOOM: Maintenance, Organization and Optimization of Memory in Ultra-Long Role-Playing Dialogues

Authors:Weishu Chen, Jinyi Tang, Zhouhui Hou, Shihao Han, Mingjie Zhan, Zhiyuan Huang, Delong Liu, Jiawei Guo, Zhicheng Zhao, Fei Su

Memory extraction is crucial for maintaining coherent ultra-long dialogues in human-robot role-playing scenarios. However, existing methods often exhibit uncontrolled memory growth. To address this, we propose MOOM, the first dual-branch memory plugin that leverages literary theory by modeling plot development and character portrayal as core storytelling elements. Specifically, one branch summarizes plot conflicts across multiple time scales, while the other extracts the user’s character profile. MOOM further integrates a forgetting mechanism, inspired by the ``competition-inhibition’’ memory theory, to constrain memory capacity and mitigate uncontrolled growth. Furthermore, we present ZH-4O, a Chinese ultra-long dialogue dataset specifically designed for role-playing, featuring dialogues that average 600 turns and include manually annotated memory information. Experimental results demonstrate that MOOM outperforms all state-of-the-art memory extraction methods, requiring fewer large language model invocations while maintaining a controllable memory capacity.

在人机角色扮演场景中,保持连贯的超长对话对话记忆提取至关重要。然而,现有方法往往会出现无法控制的内存增长。针对这一问题,我们提出了MOOM,这是第一个利用文学理论对情节发展和人物刻画进行建模的双分支内存插件,作为核心叙事元素。具体来说,一个分支总结跨越多个时间尺度的情节冲突,而另一个分支提取用户的角色特征。MOOM进一步集成了一种遗忘机制,灵感来自“竞争抑制”记忆理论,以限制内存容量并缓解不受控制的增长。此外,我们还推出了专为角色扮演设计的ZH-4O中文超长对话数据集,其中包括平均600回合的对话,并附有手动标注的记忆信息。实验结果表明,MOOM优于所有最先进的记忆提取方法,在保持可控内存容量的同时,减少了大型语言模型的调用次数。

论文及项目相关链接

PDF

摘要

针对在人机角色扮演场景中保持超长对话连贯性的重要问题,现有的记忆提取方法常常面临不可控制的内存增长问题。为解决这一问题,本文提出了MOOM,首个双分支记忆插件,利用文学理论建立情节发展和人物刻画的核心叙事元素模型。其中一支用于总结跨越多个时间尺度的情节冲突,另一支用于提取用户角色特征。此外,MOOM结合了记忆理论中的“竞争抑制”机制,以控制内存容量并缓解不受控制的增长问题。同时,本文还推出了专为角色扮演设计的中文超长对话数据集ZH-4O,包含平均600轮对话,并附有手动标注的记忆信息。实验结果表明,MOOM在记忆提取方面的性能优于所有最先进的方法,在保持可控内存容量的情况下减少了大型语言模型的调用次数。

关键见解

  1. 记忆提取对于维持人机角色扮演场景中的超长对话连贯性至关重要。
  2. 现有方法面临不可控制的内存增长问题。
  3. MOOM是双分支记忆插件,利用文学理论建模情节发展和人物刻画。
  4. MOOM的一个分支总结跨多个时间尺度的情节冲突,另一分支提取用户角色特征。
  5. MOOM结合“竞争抑制”记忆理论来控制内存容量并缓解内存增长问题。
  6. 推出ZH-4O数据集,专为角色扮演设计的中文超长对话数据集,包含丰富的对话内容和手动标注的记忆信息。

Cool Papers

点此查看论文截图

Swarm Intelligence for Chemical Reaction Optimisation

Authors:Rémi Schlama, Joshua W. Sin, Ryan P. Burwood, Kurt Püntener, Raphael Bigler, Philippe Schwaller

Chemical reaction optimisation is essential for synthetic chemistry and pharmaceutical development, demanding the extensive exploration of many reaction parameters to achieve efficient and sustainable processes. We report $\alpha$-PSO, a novel nature-inspired metaheuristic algorithm that augments canonical particle swarm optimisation (PSO) with machine learning (ML) for parallel reaction optimisation. Unlike black-box ML approaches that obscure decision-making processes, $\alpha$-PSO uses mechanistically clear optimisation strategies through simple, physically intuitive swarm dynamics directly connected to experimental observables, enabling practitioners to understand the components driving each optimisation decision. We establish a theoretical framework for reaction landscape analysis using local Lipschitz constants to quantify reaction space “roughness”, distinguishing between smoothly varying landscapes with predictable surfaces and rough landscapes with many reactivity cliffs. This analysis guides adaptive $\alpha$-PSO parameter selection, optimising performance for different reaction topologies. Systematic evaluation of $\alpha$-PSO across pharmaceutically relevant reaction benchmarks demonstrates competitive performance with state-of-the-art Bayesian optimisation methods, while two prospective high-throughput experimentation (HTE) campaigns showed that $\alpha$-PSO identified optimal reaction conditions more rapidly than Bayesian optimisation. $\alpha$-PSO combines the predictive capability of advanced black-box ML methods with interpretable metaheuristic procedures, offering chemists an effective framework for parallel reaction optimisation that maintains methodological clarity while achieving highly performant experimental outcomes. Alongside our open-source $\alpha$-PSO implementation, we release $989$ new high-quality Pd-catalysed Buchwald-Hartwig and Suzuki reactions.

化学反应优化对于合成化学和药物开发至关重要,需要广泛探索许多反应参数以实现高效和可持续的过程。我们报告了一种新的自然启发型元启发式算法$\alpha$-PSO,它通过机器学习与标准粒子群优化(PSO)相结合,用于并行反应优化。与掩盖决策过程的黑箱机器学习方法不同,$\alpha$-PSO使用机制清晰的优化策略,通过简单、直观的物理群体动力学与实验观测直接相连,使从业者能够了解推动每个优化决策的组成部分。我们建立了基于局部Lipschitz常数的反应景观分析理论框架,以量化反应空间的“粗糙度”,区分具有可预测表面的平滑变化景观和具有许多反应性悬崖的粗糙景观。这种分析指导了自适应$\alpha$-PSO参数的选择,针对不同的反应拓扑优化了性能。$\alpha$-PSO在药物相关的反应基准测试上的系统评估表明,其性能与最先进的贝叶斯优化方法具有竞争力,而两项前瞻性的高通量实验(HTE)活动表明,$\alpha$-PSO比贝叶斯优化更快地确定了最佳反应条件。$\alpha$-PSO结合了先进的黑箱机器学习方法的预测能力与可解释的元启发式程序,为化学家提供了一个有效的并行反应优化框架,既保持方法论的清晰度,又实现高度有效的实验结果。我们除了公开提供$\alpha$-PSO的实现源代码外,还发布了989种新的高质量Pd催化的Buchwald-Hartwig和Suzuki反应。

论文及项目相关链接

PDF

Summary

本文介绍了一种新型的自然启发元启发式算法α-PSO,该算法结合了经典粒子群优化(PSO)与机器学习(ML)用于化学反应优化。它通过直观的群体动态与实验观测结果相联系,理解决策驱动因素。文章建立了反应地貌分析的理论框架,使用局部Lipschitz常数来量化反应空间的“粗糙度”,并展示了α-PSO在药物合成反应中的性能优势。

Key Takeaways

  1. α-PSO是一种结合粒子群优化和机器学习的自然启发元启发式算法,用于化学反应优化。
  2. α-PSO通过直观的群体动态与实验观测结果相联系,具有清晰明确的决策机制。
  3. 文章建立了反应地貌分析的理论框架,区分了平滑变化的景观和具有许多反应悬崖的粗糙景观。
  4. 使用局部Lipschitz常数来量化反应空间的“粗糙度”,以指导α-PSO参数的选择。
  5. α-PSO在药物合成反应优化的性能评估中,表现出与最先进的贝叶斯优化方法相当的竞争力。
  6. 高通量实验表明,α-PSO相比贝叶斯优化能更快速地找到最佳反应条件。

Cool Papers

点此查看论文截图

Pre-Storage Reasoning for Episodic Memory: Shifting Inference Burden to Memory for Personalized Dialogue

Authors:Sangyeop Kim, Yohan Lee, Sanghwa Kim, Hyunjong Kim, Sungzoon Cho

Effective long-term memory in conversational AI requires synthesizing information across multiple sessions. However, current systems place excessive reasoning burden on response generation, making performance significantly dependent on model sizes. We introduce PREMem (Pre-storage Reasoning for Episodic Memory), a novel approach that shifts complex reasoning processes from inference to memory construction. PREMem extracts fine-grained memory fragments categorized into factual, experiential, and subjective information; it then establishes explicit relationships between memory items across sessions, capturing evolution patterns like extensions, transformations, and implications. By performing this reasoning during pre-storage rather than when generating a response, PREMem creates enriched representations while reducing computational demands during interactions. Experiments show significant performance improvements across all model sizes, with smaller models achieving results comparable to much larger baselines while maintaining effectiveness even with constrained token budgets. Code and dataset are available at https://github.com/sangyeop-kim/PREMem.

有效的长期对话式人工智能记忆需要跨多个会话进行信息综合。然而,当前系统对响应生成的推理负担过重,导致性能高度依赖于模型规模。我们引入了PREMem(用于情景记忆的预存储推理),这是一种新方法,它将复杂的推理过程从推理转移到记忆构建。PREMem提取了精细粒度的记忆片段,并将其分类为事实、经验和主观信息;然后,它在跨会话的记忆项之间建立明确的关系,捕捉诸如扩展、转换和隐含之类的演变模式。通过在预存储期间进行这种推理,而不是在生成响应时进行,PREMem创建了丰富的表示形式,同时减少了交互期间的计算需求。实验表明,在所有模型大小方面,性能均有显著提高,较小的模型在保持有效性的同时实现了与更大的基准线相当的结果,即使在有限的令牌预算中也是如此。代码和数据集可在https://github.com/sangyeop-kim/PREMem找到。

论文及项目相关链接

PDF Accepted by EMNLP 2025 (Findings)

Summary
对话AI的长期记忆有效性需要跨多个会话合成信息。现有系统过分依赖响应生成进行推理,性能严重依赖于模型规模。我们推出PREMem(针对情景记忆的预存储推理),将复杂的推理过程从推理转移到记忆构建。PREMem提取精细的记忆片段,将其分类为事实、经验和主观信息;然后建立跨会话的记忆项之间的明确关系,捕捉演变模式,如扩展、转换和暗示。它在预存储期间进行推理,而不是在生成响应时,从而创建丰富的表示形式,同时减少交互期间的计算需求。实验表明,所有模型性能均有显著提高,较小的模型能在有限的标记预算内实现与大型基准测试相当的结果,同时保持有效性。

Key Takeaways

  1. 对话AI的长期记忆需要跨会话合成信息以增强有效性。
  2. 当前系统在响应生成中承担过多推理任务,导致性能依赖于模型规模。
  3. PREMem通过预存储推理来改进这一状况,将复杂推理从推理阶段移至记忆构建阶段。
  4. PREMem能够提取并分类记忆片段,包括事实、经验和主观信息。
  5. PREMem建立跨会话的记忆项之间的明确关系,以捕捉诸如扩展、转换和暗示等演变模式。
  6. 通过在预存储期间进行推理,PREMem减少了响应生成时的计算需求,同时创建了丰富的表示形式。

Cool Papers

点此查看论文截图

Data-Driven Discovery of Emergent Dynamics in Reaction-Diffusion Systems from Sparse and Noisy Observations

Authors:Saumitra Dwivedi, Ricardo da Silva Torres, Ibrahim A. Hameed, Gunnar Tufte, Anniken Susanne T. Karlsen

Data-driven discovery of emergent dynamics is gaining popularity, particularly in the context of reaction-diffusion systems. These systems are widely studied across various fields, including neuroscience, ecology, epidemiology, and several other subject areas that deal with emergent dynamics. A current challenge in the discovery process relates to system identification when there is no prior knowledge of the underlying physics. We attempt to address this challenge by learning Soft Artificial Life (Soft ALife) models, such as Agent-based and Cellular Automata (CA) models, from observed data for reaction-diffusion systems. In this paper, we present findings on the applicability of a conceptual framework, the Data-driven Rulesets for Soft Artificial Life (DRSALife) model, to learn Soft ALife rulesets that accurately represent emergent dynamics in a reaction-diffusion system from observed data. This model has demonstrated promising results for Elementary CA Rule 30, Game of Life, and Vicsek Flocking problems in recent work. To our knowledge, this is one of the few studies that explore machine-based Soft ALife ruleset learning and system identification for reaction-diffusion dynamics without any prior knowledge of the underlying physics. Moreover, we provide comprehensive findings from experiments investigating the potential effects of using noisy and sparse observed datasets on learning emergent dynamics. Additionally, we successfully identify the structure and parameters of the underlying partial differential equations (PDEs) representing these dynamics. Experimental results demonstrate that the learned models are able to predict the emergent dynamics with good accuracy (74%) and exhibit quite robust performance when subjected to Gaussian noise and temporal sparsity.

数据驱动的新兴动态发现正变得越来越受欢迎,特别是在反应-扩散系统背景下。这些系统广泛应用于各个领域,包括神经科学、生态学、流行病学以及处理新兴动态的其它学科领域。当前发现过程中的一个挑战与缺乏系统识别有关,即当对基础物理学没有先验知识时如何进行系统识别。我们试图通过从观察到的反应-扩散系统的数据中学习软人工生命(Soft ALife)模型来解决这一挑战,例如基于代理的模型和细胞自动机(CA)模型。在本文中,我们介绍了数据驱动规则集(DRSALife)模型框架的适用性发现,该模型能够学习软人工生命规则集,从而准确代表从观察到的数据中反应-扩散系统的新兴动态。该模型在最近的工作中已经在Elementary CA Rule 30、生命游戏和Vicsek集群问题中取得了有前景的结果。据我们所知,这是少数研究之一,探索了基于机器学习的软人工生命规则集学习以及反应-扩散动力学的系统识别,而无需了解其基本物理学的先验知识。此外,我们还提供了全面的实验发现结果,研究了使用噪声和稀疏观测数据集对学习新兴动态的影响。此外,我们还成功确定了代表这些动态的底层偏微分方程(PDEs)的结构和参数。实验结果表明,所学习的模型能够以良好的准确性(74%)预测新兴动态,并且在受到高斯噪声和时间稀疏性影响时表现出相当稳健的性能。

论文及项目相关链接

PDF

摘要
基于数据驱动的涌现动态发现正日益流行,特别是在反应扩散系统背景下。本研究尝试通过学习软人工生命模型来解决缺乏先验知识带来的系统识别挑战。文章展示了数据驱动规则集模型(DRSALife)在反应扩散系统中涌现动态表示的准确性,以及使用它预测准确的可靠性研究前景,模型的稳健性能在对数据进行测试验证后有进一步的可靠性确认。我们对游戏规则问题做了进一步的研究和探讨,在解决新兴动力学问题方面,本研究展示了一种新颖的学习规则集方式。通过噪声和稀疏观测数据集对学习新兴动力学潜在影响的研究结果也是一大亮点。在理解了该研究的基本思路和方法后,我们对当前文献的研究范围有所启发,对后续研究具有指导意义。总之,本文的研究为反应扩散系统的涌现动态学习提供了新思路。

关键见解

一、数据驱动的发现方法在反应扩散系统的研究中备受关注,尤其是在系统识别方面的应用前景广阔。针对缺乏先验知识带来的挑战,尝试通过学习和利用软人工生命模型解决,表现出很强的创新性。
二、Data驱动规则集(DRSALife)模型的建立具有重要突破性和启示性,已在多个问题上展示出学习软人工生命规则集的能力,能够准确代表反应扩散系统中的新兴动态。
三、对游戏规则问题的研究是本文的一大亮点,提出了一种新颖的学习规则集方式来解决新兴动力学问题。这一创新思路为后续研究提供了新的方向。
四、本文还研究了噪声和稀疏观测数据集对新兴动力学学习的影响,这是当前的热门研究方向。基于实证研究的结果丰富和深入了这一研究领域的内容理解。
五、实验结果表明,学习模型预测新兴动态的准确性较高(准确率可达74%),并且在面对高斯噪声和时间稀疏性时表现出稳健的性能。这一发现对实际应用具有重要的指导意义。
六、该研究展示了利用机器学习技术来识别和预测反应扩散系统的动力学行为的可能性,进一步推动了机器学习在复杂系统中的应用和发展。
七、本文不仅提供了丰富的实验数据和结果分析,还指出了未来研究方向的潜在挑战和机遇,为后续研究提供了重要的参考和指导。

Cool Papers

点此查看论文截图


文章作者: Kedreamix
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Kedreamix !
 上一篇
Talking Head Generation Talking Head Generation
Talking Head Generation 方向最新论文已更新,请持续关注 Update in 2025-09-18 Talking to DINO Bridging Self-Supervised Vision Backbones with Language for Open-Vocabulary Segmentation
下一篇 
TTS TTS
TTS 方向最新论文已更新,请持续关注 Update in 2025-09-17 FuseCodec Semantic-Contextual Fusion and Supervision for Neural Codecs
2025-09-17
  目录