喜讯!陈文智教授团队论文被IJCAI 2024录用

       浙江大学计算机系统结构实验室包晗的论文“Pluggable Watermarking of Deepfake Models for Deepfake Detection”20244月被人工智能领域的International Joint Conference on Artificial Intelligence (IJCAI 2024) 会议录用。该论文由陈文智教授和王总辉教授指导,针对现有的Deepfake伪造检测方法存在泛化性不高,鲁棒性较差的问题,提出了一种主动式模型水印技术,在生成图像中加入不可见水印便于检测。该方法为Deepfake检测提供了新思路。

会议介绍

国际人工智能联合会议(International Joint Conference on Artificial Intelligence, 简称为IJCAI)是人工智能领域中最主要的学术会议之一,近年来论文录取率为12%-15%


Deepfake检测的重要性和检测中遇到的难点

Deepfake技术已经取得了显著的进步,一个人的脸可以从不同的照片中完美地与另一个人交换。此类Deepfakes的潜在滥用和猖獗扩散引起了重大的社会关注,并危及在线媒体的可信度。因此,迫切需要人脸伪造检测技术。当前主流的Deepfake检测方法通常通过以被动方式提取图像中的生物特征和高频伪影来识别Deepfake图像。然而,当Deepfake图像变得更逼真或通过有损信道传输时,被动检测可能无法检测到它们,这些方法在面对多种Deepfake生成方式时,其泛化性和鲁棒性收到严重考验。为此,本文提出一种主动水印技术,在Deepfake生成网络中加入可插拔的通用水印,这样通过检测水印的存在即可判断图像的真实性。


通用的可插拔式Deepfake模型水印

Deepfake场景下,对水印的要求较高,首先需要适配不同网络结构的生成方法,其次需要保证生成质量,最后需要保证水印检测的准确性。通过对大量Deepfake生成方法的分析,本文发现所有的生成方法在最后都需要卷积解码器进行图像的生成。本文提出了一种针对卷积核的高效的、可插入的模型水印框架。具体来说,通过卷积核稀疏化确定卷积核的冗余参数,将卷积核参数核水印参数归一化保证生成质量。本文的方法在设计上独立于原始模型训练,在保持生成图像质量的同时提高检测效率。大量实验证明了本文的方法在各种Deepfake生成模型中的适应性,同时即使在有损环境中也能保持高精度。此外,消融研究和自适应攻击验证了本文的方法在很小训练参数的情况下即是有效的,并且能够抵抗自适应攻击。

作者介绍

论文第一作者包晗和第四作者梁康明分别为为浙江大学计算机系统结构实验室(ZJU ARClab)在读博士生和在读硕士生,主要研究方向为多媒体内容安全、信息对抗理论与技术等。

 


<<< 返回