Talk2Paper

Face Swapping 方向最新论文已更新，请持续关注 Update in 2025-11-19 Whose Narrative is it Anyway? A KV Cache Manipulation Attack

2025-11-19 Face Swapping

Speech 方向最新论文已更新，请持续关注 Update in 2025-11-19 PASE Leveraging the Phonological Prior of WavLM for Low-Hallucination Generative Speech Enhancement

2025-11-19 Speech

Speech

无监督/半监督/对比学习

无监督/半监督/对比学习方向最新论文已更新，请持续关注 Update in 2025-11-19 SAGE Saliency-Guided Contrastive Embeddings

2025-11-19 无监督/半监督/对比学习

无监督/半监督/对比学习

检测/分割/跟踪

检测/分割/跟踪方向最新论文已更新，请持续关注 Update in 2025-11-19 Referring Camouflaged Object Detection With Multi-Context Overlapped Windows Cross-Attention

2025-11-19 检测/分割/跟踪

检测/分割/跟踪

Vision Transformer

Vision Transformer 方向最新论文已更新，请持续关注 Update in 2025-11-19 MergeSlide Continual Model Merging and Task-to-Class Prompt-Aligned Inference for Lifelong Learning on Whole Slide Images

2025-11-19 Vision Transformer

Vision Transformer

视频理解

视频理解方向最新论文已更新，请持续关注 Update in 2025-11-19 CacheFlow Compressive Streaming Memory for Efficient Long-Form Video Understanding

2025-11-19 视频理解

视频理解

I2I Translation

I2I Translation 方向最新论文已更新，请持续关注 Update in 2025-11-19 Free-Form Scene Editor Enabling Multi-Round Object Manipulation like in a 3D Engine

2025-11-19 I2I Translation

I2I Translation

Few-Shot

Few-Shot 方向最新论文已更新，请持续关注 Update in 2025-11-19 Part-X-MLLM Part-aware 3D Multimodal Large Language Model

2025-11-19 Few-Shot

Few-Shot

MMT

MMT 方向最新论文已更新，请持续关注 Update in 2025-11-19 VIR-Bench Evaluating Geospatial and Temporal Understanding of MLLMs via Travel Video Itinerary Reconstruction

2025-11-19 MMT

MMT

Agent

Agent 方向最新论文已更新，请持续关注 Update in 2025-11-19 Live-SWE-agent Can Software Engineering Agents Self-Evolve on the Fly?

2025-11-19 Agent

Agent

LLM

LLM 方向最新论文已更新，请持续关注 Update in 2025-11-19 Crossing Borders A Multimodal Challenge for Indian Poetry Translation and Image Generation

2025-11-19 LLM

LLM

R1_Reasoning

R1_Reasoning 方向最新论文已更新，请持续关注 Update in 2025-11-19 Crossing Borders A Multimodal Challenge for Indian Poetry Translation and Image Generation

2025-11-19 R1_Reasoning

R1_Reasoning

Talking Head Generation

Talking Head Generation 方向最新论文已更新，请持续关注 Update in 2025-11-18 Speech-Aware Long Context Pruning and Integration for Contextualized Automatic Speech Recognition

2025-11-18 Talking Head Generation

Talking Head Generation

Text-to-Motion

Text-to-Motion 方向最新论文已更新，请持续关注 Update in 2025-11-18 DEFT-LLM Disentangled Expert Feature Tuning for Micro-Expression Recognition

2025-11-18 Text-to-Motion

Text-to-Motion

Interactive

Interactive 方向最新论文已更新，请持续关注 Update in 2025-11-18 AV-Dialog Spoken Dialogue Models with Audio-Visual Input

2025-11-18 Interactive

Interactive

TTS

TTS 方向最新论文已更新，请持续关注 Update in 2025-11-18 CLARITY Contextual Linguistic Adaptation and Accent Retrieval for Dual-Bias Mitigation in Text-to-Speech Generation

2025-11-18 TTS

TTS

医学图像

医学图像方向最新论文已更新，请持续关注 Update in 2025-11-18 LARM A Large Articulated-Object Reconstruction Model

2025-11-18 医学图像

医学图像

Diffusion Models

Diffusion Models 方向最新论文已更新，请持续关注 Update in 2025-11-18 Intrinsic Dimension Estimation for Radio Galaxy Zoo using Diffusion Models

2025-11-18 Diffusion Models

Diffusion Models

NeRF

NeRF 方向最新论文已更新，请持续关注 Update in 2025-11-18 High Mobility Multiple-Channel AlScN/GaN Heterostructures

2025-11-18 NeRF

NeRF

3DGS

3DGS 方向最新论文已更新，请持续关注 Update in 2025-11-18 3D Gaussian and Diffusion-Based Gaze Redirection

2025-11-18 3DGS

3DGS

元宇宙/虚拟人

元宇宙/虚拟人方向最新论文已更新，请持续关注 Update in 2025-11-18 BecomingLit Relightable Gaussian Avatars with Hybrid Neural Shading

2025-11-18 元宇宙/虚拟人

元宇宙/虚拟人