嘘~ 正在从服务器偷取页面 . . .

GAN


⚠️ 以下所有内容总结都来自于 大语言模型的能力,如有错误,仅供参考,谨慎使用
🔴 请注意:千万不要用于严肃的学术场景,只能用于论文阅读前的初筛!
💗 如果您觉得我们的项目对您有帮助 ChatPaperFree ,还请您给我们一些鼓励!⭐️ HuggingFace免费体验

2025-10-04 更新

ZK-WAGON: Imperceptible Watermark for Image Generation Models using ZK-SNARKs

Authors:Aadarsh Anantha Ramakrishnan, Shubham Agarwal, Selvanayagam S, Kunwar Singh

As image generation models grow increasingly powerful and accessible, concerns around authenticity, ownership, and misuse of synthetic media have become critical. The ability to generate lifelike images indistinguishable from real ones introduces risks such as misinformation, deepfakes, and intellectual property violations. Traditional watermarking methods either degrade image quality, are easily removed, or require access to confidential model internals - making them unsuitable for secure and scalable deployment. We are the first to introduce ZK-WAGON, a novel system for watermarking image generation models using the Zero-Knowledge Succinct Non Interactive Argument of Knowledge (ZK-SNARKs). Our approach enables verifiable proof of origin without exposing model weights, generation prompts, or any sensitive internal information. We propose Selective Layer ZK-Circuit Creation (SL-ZKCC), a method to selectively convert key layers of an image generation model into a circuit, reducing proof generation time significantly. Generated ZK-SNARK proofs are imperceptibly embedded into a generated image via Least Significant Bit (LSB) steganography. We demonstrate this system on both GAN and Diffusion models, providing a secure, model-agnostic pipeline for trustworthy AI image generation.

随着图像生成模型的强大性和可访问性不断增长,关于合成媒体的真实性、所有权和误用的担忧变得至关重要。能够生成与现实无法区分的逼真图像,带来了诸如虚假信息、深度伪造和知识产权侵犯等风险。传统的水印方法要么会降低图像质量,要么容易被移除,或者需要访问保密模型内部,这使得它们不适合进行安全和可扩展的部署。我们首次引入了ZK-WAGON系统,这是一种使用零知识简洁非交互式论证知识(ZK-SNARKs)为图像生成模型加水印的新方法。我们的方法能够在不暴露模型权重、生成提示或任何敏感内部信息的情况下,验证图像来源。我们提出了选择性层ZK电路创建(SL-ZKCC)方法,该方法能够有选择地将图像生成模型的关键层转换为电路,从而显著减少证明生成时间。生成的ZK-SNARK证明通过最低有效位(LSB)隐写术不可察觉地嵌入到生成的图像中。我们在生成对抗网络(GAN)和扩散模型上都展示了这一系统,为可信的AI图像生成提供了一个安全、模型无关的流程。

论文及项目相关链接

PDF Accepted at AI-ML Systems 2025, Bangalore, India, https://www.aimlsystems.org/2025/

Summary
随着图像生成模型的强大和普及,关于合成媒体的真实性和所有权问题变得愈发重要。生成逼真图像的能力可能导致误传信息、深度伪造和侵犯知识产权等风险。传统的水印方法要么会降低图像质量,要么容易被移除,或者需要访问模型的内部机密信息,因此不适合进行安全且可扩展的部署。本文首次引入ZK-WAGON系统,采用零知识简洁非交互式论证知识(ZK-SNARKs)为图像生成模型添加水印。此方法可以在不暴露模型权重、生成提示或任何敏感内部信息的情况下验证图像来源。本文提出选择性层ZK电路创建(SL-ZKCC)方法,将图像生成模型的关键层选择性转换为电路,大幅减少证明生成时间。通过最低有效位(LSB)隐写术将生成的ZK-SNARK证明嵌入生成的图像中。该系统在GAN和扩散模型上均得到验证,为可信AI图像生成提供了一个安全、模型无关的解决方案。

Key Takeaways

  1. 图像生成模型的普及引发关于真实性和所有权问题的关注。
  2. 生成逼真图像可能导致误传信息、深度伪造和侵犯知识产权等风险。
  3. 传统水印方法不适用于图像生成模型的验证,因为它们不适合大规模部署并且存在安全风险。
  4. ZK-WAGON系统利用ZK-SNARKs为图像生成模型提供新型水印方法。
  5. 该方法能够在不暴露模型敏感信息的情况下验证图像来源。
  6. SL-ZKCC方法将图像生成模型的关键层转换为电路,提高证明生成效率。

Cool Papers

点此查看论文截图

UCD: Unconditional Discriminator Promotes Nash Equilibrium in GANs

Authors:Mengfei Xia, Nan Xue, Jiapeng Zhu, Yujun Shen

Adversarial training turns out to be the key to one-step generation, especially for Generative Adversarial Network (GAN) and diffusion model distillation. Yet in practice, GAN training hardly converges properly and struggles in mode collapse. In this work, we quantitatively analyze the extent of Nash equilibrium in GAN training, and conclude that redundant shortcuts by inputting condition in $D$ disables meaningful knowledge extraction. We thereby propose to employ an unconditional discriminator (UCD), in which $D$ is enforced to extract more comprehensive and robust features with no condition injection. In this way, $D$ is able to leverage better knowledge to supervise $G$, which promotes Nash equilibrium in GAN literature. Theoretical guarantee on compatibility with vanilla GAN theory indicates that UCD can be implemented in a plug-in manner. Extensive experiments confirm the significant performance improvements with high efficiency. For instance, we achieved \textbf{1.47 FID} on the ImageNet-64 dataset, surpassing StyleGAN-XL and several state-of-the-art one-step diffusion models. The code will be made publicly available.

对抗性训练被证明是一步生成的关键,特别是在生成对抗网络(GAN)和扩散模型蒸馏中。然而在实践中,GAN训练很难正确收敛,并且在模式崩溃中挣扎。在这项工作中,我们定量分析了GAN训练中纳什均衡的程度,并得出结论:在D中输入条件的冗余捷径阻碍了有意义的知识提取。因此,我们提出采用无条件鉴别器(UCD),其中D被强制提取更综合和更稳健的特征,没有条件注入。通过这种方式,D能够利用更好的知识来监督G,这促进了GAN文献中的纳什均衡。与常规GAN理论兼容的理论保证表明UCD可以以插件方式实现。大量实验证实了显著的性能改进和高效率。例如,我们在ImageNet-64数据集上取得了1.47 FID的成绩,超过了StyleGAN-XL和几种先进的一步扩散模型。代码将公开可用。

论文及项目相关链接

PDF

Summary
本论文探讨了对抗训练在生成对抗网络(GAN)和扩散模型蒸馏中的关键作用。针对GAN训练难以收敛和模式崩溃的问题,本研究对GAN训练中的纳什均衡程度进行了定量分析,并发现将条件输入D会阻碍知识的提取。因此,研究提出了无条件判别器(UCD),使D能够提取更全面和稳健的特征,从而促进GAN文献中的纳什均衡。实验证明,UCD在性能上取得了显著的提升,并在ImageNet-64数据集上实现了1.47的FID,超越了StyleGAN-XL和其他一流的一步扩散模型。

Key Takeaways

  1. 对抗训练在生成对抗网络(GAN)和扩散模型蒸馏中扮演关键角色。
  2. GAN训练存在收敛困难和模式崩溃的问题。
  3. 将条件输入D会阻碍知识的提取,这是导致GAN训练问题的一个原因。
  4. 提出无条件判别器(UCD),能够提取更全面和稳健的特征。
  5. UCD促进了GAN中的纳什均衡。
  6. UCD在性能上取得了显著的提升,并在ImageNet-64数据集上实现了低FID值。

Cool Papers

点此查看论文截图


文章作者: Kedreamix
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Kedreamix !
 上一篇
元宇宙/虚拟人 元宇宙/虚拟人
元宇宙/虚拟人 方向最新论文已更新,请持续关注 Update in 2025-10-04 MPMAvatar Learning 3D Gaussian Avatars with Accurate and Robust Physics-Based Dynamics
下一篇 
Speech Speech
Speech 方向最新论文已更新,请持续关注 Update in 2025-10-04 High-Fidelity Speech Enhancement via Discrete Audio Tokens
2025-10-04
  目录