嘘~ 正在从服务器偷取页面 . . .

无监督/半监督/对比学习


⚠️ 以下所有内容总结都来自于 大语言模型的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验

2025-06-10 更新

PCEvolve: Private Contrastive Evolution for Synthetic Dataset Generation via Few-Shot Private Data and Generative APIs

Authors:Jianqing Zhang, Yang Liu, Jie Fu, Yang Hua, Tianyuan Zou, Jian Cao, Qiang Yang

The rise of generative APIs has fueled interest in privacy-preserving synthetic data generation. While the Private Evolution (PE) algorithm generates Differential Privacy (DP) synthetic images using diffusion model APIs, it struggles with few-shot private data due to the limitations of its DP-protected similarity voting approach. In practice, the few-shot private data challenge is particularly prevalent in specialized domains like healthcare and industry. To address this challenge, we propose a novel API-assisted algorithm, Private Contrastive Evolution (PCEvolve), which iteratively mines inherent inter-class contrastive relationships in few-shot private data beyond individual data points and seamlessly integrates them into an adapted Exponential Mechanism (EM) to optimize DP’s utility in an evolution loop. We conduct extensive experiments on four specialized datasets, demonstrating that PCEvolve outperforms PE and other API-assisted baselines. These results highlight the potential of leveraging API access with private data for quality evaluation, enabling the generation of high-quality DP synthetic images and paving the way for more accessible and effective privacy-preserving generative API applications. Our code is available at https://github.com/TsingZ0/PCEvolve.

生成式API的兴起引发了对于隐私保护合成数据生成的兴趣。虽然Private Evolution(PE)算法使用扩散模型API生成符合差分隐私(DP)的合成图像,但由于其DP保护相似性投票方法的局限性,它在小样本私有数据方面遇到了困难。在实践中,小样本私有数据挑战在医疗和工业等特定领域尤为普遍。为了应对这一挑战,我们提出了一种新的API辅助算法——Private Contrastive Evolution(PCEvolve)。该算法迭代挖掘小样本私有数据中固有的类间对比关系,超越单个数据点,并无缝集成到适应的指数机制(EM)中,在进化循环中优化DP的实用性。我们在四个专用数据集上进行了广泛实验,表明PCEvolve在性能和效果上超过了PE和其他API辅助基线。这些结果突显了在质量评估方面利用API访问私有数据的潜力,能够实现生成高质量DP合成图像,并为更可访问和有效的隐私保护生成式API应用程序铺平道路。我们的代码位于https://github.com/TsingZ0/PCEvolve。

论文及项目相关链接

PDF Accepted as ICML Spotlight (top 2.6%)

Summary

该文本介绍了生成式API的兴起对隐私保护合成数据生成的影响。针对Private Evolution算法在少样本私有数据方面的局限性,提出了Private Contrastive Evolution算法。新算法通过挖掘少样本私有数据中内在的类间对比关系,并优化指数机制,在进化循环中提高了差分隐私的实用性。实验证明,Private Contrastive Evolution在四个专业数据集上的表现优于PE和其他API辅助基线,展示了API访问在私有数据质量评估中的潜力,为生成高质量差分隐私合成图像以及更可访问和有效的隐私保护生成式API应用铺平了道路。

Key Takeaways

  1. 生成式API的普及推动了隐私保护合成数据生成的研究。
  2. Private Evolution算法在生成差分隐私合成图像时面临少样本私有数据的挑战。
  3. Private Contrastive Evolution算法通过挖掘少样本私有数据中的类间对比关系来解决这一挑战。
  4. Private Contrastive Evolution优化了指数机制,提高了差分隐私的实用性。
  5. 在四个专业数据集上的实验表明,Private Contrastive Evolution算法的性能优于PE和其他API辅助基线。
  6. API访问在私有数据质量评估中具有潜力。

Cool Papers

点此查看论文截图


文章作者: Kedreamix
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Kedreamix !
 上一篇
Speech Speech
Speech 方向最新论文已更新,请持续关注 Update in 2025-06-10 CLaMR Contextualized Late-Interaction for Multimodal Content Retrieval
2025-06-10
下一篇 
检测/分割/跟踪 检测/分割/跟踪
检测/分割/跟踪 方向最新论文已更新,请持续关注 Update in 2025-06-10 Domain-RAG Retrieval-Guided Compositional Image Generation for Cross-Domain Few-Shot Object Detection
  目录