最先进分类器也可能误判!科学家设计攻击实验,分类准确率下降到0.1以下

2020-04-10 08:41:17 来源:网络整理 作者:管理员

原标题:最先进分类器也可能误判!科学家设计攻击实验,分类准确率下降到0.1以下

最先进分类器也可能误判!科学家设计攻击实验,分类准确率下降到0.1以下

智东西(公众号:zhidxcom)

编 | 董温淑

备选标题:

1、AI分类器可能误判!科学家设计攻击实验,让Deepfake以假乱真

2、指望AI鉴别Deepfake?最新研究显示可靠性较低

智东西4月9日消息,谷歌公司和加州大学伯克利分校的研究人员最近的一项研究显示,现有的鉴定分类器在一些情况下不能有效甄别出Deepfake作品。

用人工智能手段进行人体图像合成被称为Deepfake。简单来说,Deepfake技术可以给图片、视频中的人物“换脸”。网络上流行的换脸app、一键脱衣app均是基于Deepfake技术实现功能。

提起Deepfake,就不能不提到滥用这种技术会造成严重恶性后果。例如此前曝出的新闻:网络IP伪造名人色情影片、犯罪分子冒充英国能源公司CEO挪用公司资金、别有用心者在大选期间传播对竞选者不利的虚假材料等等。

为了避免这种情况,许多网站引入了能够区分真假内容的AI鉴定分类系统。

然而,谷歌公司和加州大学伯克利分校的研究表明,即使是最先进的分类器也很容易被攻击影响。

无独有偶,另一个由加州大学圣地亚哥分校主导的研究也表明,只要在虚假视频中添加一些信息,分类器就无法把它辨别出来。

这些研究结果为我们敲响了警钟:目前的分类器并不是100%可靠,仍需警惕Deepfake制作的虚假信息。

目前谷歌和加州大学伯克利分校的研究已经发表在学术网站arXiv上,论文标题为《用白盒、黑盒攻击绕过Deepfake图像鉴别工具(Evading Deepfake-Image Detectors with White- and Black-Box Attacks)》

论文链接:https://arxiv.org/pdf/2004.00622.pdf

最先进分类器也可能误判!科学家设计攻击实验,分类准确率下降到0.1以下

实验中用到的假图像基于生成对抗网络(generative adversarial networks,GAN)来合成。GAN由一个生成网络和一个判别网络组成。

GAN模型的学习过程就是生成网络和判别网络的相互博弈的过程:生成网络从潜在空间中随机取样作为输入,目标是输出与训练集中样本一致的图像。判别网络的目标则是判定生成网络的输出是否属于训练集。

经过一段时间的学习,生成网络输出的图像将与训练集中的十分相似,不能被判别网络识别出来。

研究人员共对3个分类器做了测试,其中两个为第三方分类器,一个为研究人员训练出的用于对照的分类器。

研究人员选用了两种不同训练方式的第三方分类器。

第一个的分类器模型基于深度残差网络ResNet-50(Deep residual network)。

研究人员预先用大型视觉数据库ImageNet对ResNet-50进行了训练。训练集中包括720000个训练图像和4000个验证图像,其中一半为真实图像,另一半是用ProGAN生成的合成图像。训练集中的图像采用空间模糊和JEPG压缩方法增强。

经过训练后,这个分类器能准确识别出ProGAN生成的图像,而且还能分类其他未被发现的图像。

第二个鉴定分类器采用的是基于相似性学习(similar learning-based)的方法。经过训练后这款分类器可以准确辨认出由不同生成器合成的图像。

研究团队还自己搭建了一个鉴定分类器模型,作为前述两个鉴定分类器的对照示例。这个分类器采用一百万个ProGAN生成的图像进行训练,其中真假图像各占一半。论文中指出,这个分类器的训练管道比前述两种简单很多,因此错误率是前面两个模型的3倍。

研究人员根据分类器是否开放了访问权限,选用了不同的攻击方式。对开发访问权限的分类器采用白盒攻击;对不开放访问权限的分类器采用黑盒攻击。

另外,研究人员用接收者操作特征曲线(ROC曲线)评估分类器的正确率。评估标准是曲线下面积(AUC)的大小。AUC的取值范围为0~1,一般来说AUC>0.5即代表分类器有预测价值,AUC值越大代表分类器准确率越高。

一、白盒攻击

对于开放了访问权限的分类器,研究人员用白盒攻击评估其稳健性。

白盒攻击即攻击者能够获知分类器所使用的算法以及算法使用的参数。在产生对抗性攻击数据的过程中,攻击者能够与分类器系统产生交互。

攻击过程中用到的所有图像都来自一个包含94036张图像的视觉数据库。

开始白盒攻击之前,基于这个数据库的分类器得到了0.97的AUC数值。即使在执行典型的清洗策略隐藏图像合成痕迹后,分类器的AUC数值仍保持在0.94以上。

接下来研究人员使用了4种白盒攻击方法。这4种攻击在之前的对抗性示例中已有过研究。攻击的具体方式是对图像进行修改,使分类器误认为它们是真实的。

最先进分类器也可能误判!科学家设计攻击实验,分类准确率下降到0.1以下

▲四种攻击前后,分类器的ROC曲线图。蓝色实线代表JPEG格式的合成图像,蓝色虚线代表PNG格式的合成图像

1、失真最小化攻击(Distortion-minimizing Attack)

失真最小化攻击即对合成图像添加一个较小的加法扰动δ。假设一个合成图像x先被分类器判定为假,施加扰动后,(x+δ)就会被判定为真。

最先进分类器也可能误判!科学家设计攻击实验,分类准确率下降到0.1以下

▲a:分类器把假图像识别为真;b:分类器把真图像识别为假。把像素翻转1%,就会有一半的假图像被判定为真;把像素翻转7%,就会有一半的真图像被判定为假。

2、损失最大化攻击(Loss-Maximizing Attack)

损失最大化攻击即定义一个更简单的目标函数,更大限度地提升合成图像被判定为真的概率。

3、通用对抗性补丁攻击(Universal Adversarial-Patch Attack)

失真最小化攻击方法有有一个局限性:攻击者需要花费0.1秒为每个图像定制攻击方式。

为了弥补这一局限性,研究人员创建了一个单一的可视噪声模板补丁。这个补丁可以叠加在任何假图像上,有效增加了假图像的迷惑性。

4、通用潜空间攻击(Universal Latent-Space Attack)

不同于之前三种方法通过对假图像施加扰动来影响分类结果,第四种攻击方法是对图像的潜在空间进行攻击。

最先进分类器也可能误判!科学家设计攻击实验,分类准确率下降到0.1以下

▲a为通用对抗性补丁攻击效果,b~d为通用潜空间攻击效果。图中所有假图像都被分类器误判为真

经过白盒攻击,分类器的AUC数值下降到了0.1以下。

二、黑盒攻击

论文指出,现实中的社交网站、约会网站等,并不会公开其鉴定分类器的算法,因此很难进行前面所说的白箱攻击。

面对这种情况,研究人员进行了黑盒攻击。黑盒攻击假设对方知道攻击的存在,并且掌握了一般的防御策略。

研究结果显示,即使在这种限制性较强的黑盒攻击条件下,鉴定分类器也很容易受到对抗性因素影响。经过黑盒攻击,分类器的AUC数值下降到0.22以下。

结语:现有分类器有局限性,仍需深入研究

谷歌公司和加州大学伯克利分校研究团队证明,只要对虚假图片适当加以处理,就能使其“骗”过分类器。

这种现象令人担忧,论文中写道:“部署这样的分类器会比不部署还糟糕,不仅虚假图像本身显得十分真实,分类器的误判还会赋予它额外的可信度”。

因此,研究人员建议开创新的检测方法,研究出可以识别经过再压缩、调整大小、降低分辨率等扰动手段处理的假图像。

据悉,目前有许多机构正在从事这一工作,如脸书、亚马逊网络服务及其他机构联合发起了“Deepfake鉴别挑战”,期待能探索出更好的解决方案。

文章来源:VentureBeat,arXiv

显示全文
为您推荐
世界第二大岛是哪个岛 被一分为二的新几内亚岛
世界第二大岛是哪个岛 被一分为二的新几内亚岛

众所周知,世界上第一大岛为格林兰岛,而世界上第二大岛则为新几内亚岛,新几内亚岛的面积同样十分的广阔,面积约为1/5个中国的面积,由于处于热带地区,所以新几内亚岛地区特别的炎热,虽然新几内亚岛里的人属于黄种人,但是他们中大多数人的皮肤都是黑色。...

发布时间:2023-11-01 03:00:07

亚马逊黄金城之谜,有去无回的恐怖密林(堆积如山的黄金)
亚马逊黄金城之谜,有去无回的恐怖密林(堆积如山的黄金)

【导读】 亚马逊黄金城之谜,有去无回的恐怖密林(堆积如山的黄金),下面是小编为你收集整理的,希望对你有帮助!在亚马逊的茂密森林中,有堆积如山的金银财宝,在森林的深处,人们称之为黄金城。去过的人都有去无回,其中包括探险队、科学家们。有关于这个黄金城之谜越传越邪乎,对于这个恐怖的黄金城人们屡试不爽,跟小编一起来......

发布时间:2023-11-01 02:01:14

世界半岛面积排行前五名 这些地方研究价值和旅游价值高
世界半岛面积排行前五名 这些地方研究价值和旅游价值高

世界半岛面积排行分别为阿拉伯半岛,印度半岛,中南半岛,拉布拉多半岛,斯堪的纳维亚半岛,这五大半岛的面积是世界半岛面积的前五名,这五大半岛各有各的特点,也位列于世界的不同地区,具有极高的研究价值和旅游价值。...

发布时间:2023-11-01 02:00:12

路由器坏了换一个需要重新设置吗
路由器坏了换一个需要重新设置吗

【导读】 路由器坏了换一个需要重新设置吗,下面是小编为你收集整理的,希望对你有帮助!新购置的路由器第一次使用都需要设置,步骤如下:1、先将网线插在路由器的WAN口,再将路由器的LAN口连接电脑;2、打开浏览器在地址栏填上路由器设置网址192.168.1.1,在路由器的背面有提示;3、......

发布时间:2023-11-01 01:01:14

史前最凶猛的动物排行榜前五名 曾经战无不胜的凶猛动物们
史前最凶猛的动物排行榜前五名 曾经战无不胜的凶猛动物们

史前最凶猛的动物排行榜前五名分别为史前巨鱼、沧龙、剑齿虎、泰坦巨蟒和霸王龙,这五大凶猛的动物,曾经是地球上其他生物的噩梦,统治着整个地球许多年但是由于生态环境的恶化以及其他的种种原因,导致了这些动物已经永远的离开了人间。...

发布时间:2023-11-01 01:00:12

导致肥胖的原因有哪些:熬夜是最大祸端(运动保持健康)
导致肥胖的原因有哪些:熬夜是最大祸端(运动保持健康)

【导读】 导致肥胖的原因有哪些:熬夜是最大祸端(运动保持健康),下面是小编为你收集整理的,希望对你有帮助!现代社会很多人都想要一副苗条的身材,但是每个人都会有肥胖的烦恼,其实那些导致人肥胖的原因就隐藏在人们的日常生活当中,如果没有一个正确的生活方式,除了对身体健康造成影响外,最容易有的表现就是肥胖了。导致......

发布时间:2023-11-01 00:01:58

十大最恐怖的鸟 这些鸟叫声让人相当害怕恐惧
十大最恐怖的鸟 这些鸟叫声让人相当害怕恐惧

十大恐怖的鸟分别为:杜鹃、乌鸦、猫头鹰、鸵鸟、马蜂、恐怖鸟、林鸱、骇鸟、四翼鸟、泰坦鸟,这十种鸟类生物,不仅外表不算好看,而且寓意十分恐怖,一般人见了这十种鸟都会快速地避开,防止惹祸上身,总之人类和其他生物对这十种鸟不算友好。...

发布时间:2023-11-01 00:00:55

螨虫长啥样
螨虫长啥样

【导读】 螨虫长啥样,下面是小编为你收集整理的,希望对你有帮助!螨虫属节肢动物门、蛛形纲、蜱螨亚纲的微型害虫。大小通常在0.5毫米左右,有4对足、一对触须,无翅和触角。虫体分为颚体和躯体,颚体由口器和颚基组成,躯体分为足体和末体,躯体和足上多毛。食性多样,如头皮屑......

发布时间:2023-10-31 23:01:58

十大熊类战斗力排名 这些巨型的熊类生物战斗力很猛
十大熊类战斗力排名 这些巨型的熊类生物战斗力很猛

十大熊类战斗力排名分别为北极熊,南美细齿巨熊,棕熊,美洲黑熊,狗熊,眼镜熊,懒熊,大熊猫,马来熊和浣熊,熊类生物的战斗力在陆地上是强者,一般老虎和狮子遇到熊类生物都要避让三分,如果发生惨烈的战争,熊类一定能够占据上风。...

发布时间:2023-10-31 23:00:56

椰子坏了是什么味道
椰子坏了是什么味道

【导读】 椰子坏了是什么味道,下面是小编为你收集整理的,希望对你有帮助!发酸发苦,闻起来有酸腐味。椰子汁变质以后,味道也会发生一定的改变,新鲜没有变质的椰子汁带有自然的香气,而且味道略甜,有明显的椰香味存在,但椰子汁在变质以后会出现明显的酸腐味,而且椰汁中的有些成分还会凝......

发布时间:2023-10-31 22:01:55

十大凶猛的鸟 这些鸟类让人类都瑟瑟发抖
十大凶猛的鸟 这些鸟类让人类都瑟瑟发抖

十大凶猛的鸟分别为:金雕、红尾鵟、楔尾雕、猎鹰、非洲冕雕、角雕、雪鸮、玉带海雕、髯鹫、猎隼,这十种鸟不论从战斗力还是从飞翔的本领上都十分强大,能够在空中和其他同类搏斗,也能够迅速地在陆地上寻找自己的食物,进行凶狠的捕猎。...

发布时间:2023-10-31 22:00:53

家庭怎样自制黑芝麻丸
家庭怎样自制黑芝麻丸

【导读】 家庭怎样自制黑芝麻丸,下面是小编为你收集整理的,希望对你有帮助!1、准备食材:黑芝麻250克、蜂蜜125克、水适量。2、准备250克的黑芝麻,清洗干净。3、清洗干净后的黑芝麻放入锅里蒸40分钟。4、蒸后的黑芝麻放入锅里小火炒干。5、炒干的黑芝麻放入破壁机中,反复打......

发布时间:2023-10-31 21:05:19