ICLR2020|华为诺亚:巧妙思想,NAS与「对抗」结合,速率提高11倍

2020-01-22 14:41:11 来源:网络整理 作者:管理员

原标题:ICLR 2020 | 华为诺亚:巧妙思想,NAS与「对抗」结合,速率提高11倍

作者丨dwilimeth

编辑丨Camel

本文转载自知乎专栏:AutoML随笔

今天介绍一篇 ICLR 2020 的工作 Adversarial AutoAugment。作者是来自华为的 Xinyu Zhang, Qiang Wang, Jian Zhang, Zhao Zhong。

之前的那些 NAS 做数据增强的工作,例如 AutoAugment,算法流程大致是这样的:用强化学习训练一个 policy generator ,从样本空间中采样,产生大量的 policy 。每一个 policy 会对应一个做分类任务的子网络,子网络使用这个 policy 来做数据增强,在数据集上随机初始化训练完后,测一下验证集上的准确率作为强化学习的 reward 更新 policy generator。

本文作者指出,这样做存在的不足之处:

  1. 计算开销大,policy generator 要从样本空间中产生大量的 policy,每一个 policy 都对应一个从头开始训练的子网络,更新 policy generator 还必要要等到整个网络训练完。为了给 AutoAugment 加速,有一些方法会提出一些 proxy tasks,比如说用小模型在数据集的一个小的子集上面搜。但是这样做存在一个 proxy tasks 和原始的任务之间的 gap,在 proxy tasks 上面最优不能保证在原始任务上也是最优的;

  2. 在分类子网络训练的过程中,policy 是静态、一成不变的。这样做可能也不是最优的。

针对这些不足,本文就提出了一种新的方法,policy generator 和分类网络能同时并行训练;此外,在分类网络的训练过程中,还能动态调整 policy 。这种方法和 AutoAugment 相比,在 ImageNet 数据集上的计算开销减少了12倍,训练时间缩短了11倍。

怎么做到的呢?作者引入了 GAN 里面的“对抗”思想,引入了 adversarial loss。整个网络可以看做两部分:一个是 policy generator,优化目标是生成那些让分类器的分类 loss 最大的数据增强 policy;一个是分类器,优化目标是在给定 policy 之后对应的分类 loss 最小。

具体的网络结构如下图所示,就是一个分类网络 target network,和一个生成 policy 的 policy network。

ICLR2020|华为诺亚:巧妙思想,NAS与「对抗」结合,速率提高11倍

在训练的过程中,policy network 会生成 M 个不同的 policy,并把这 M 个 policy 作用于相同的数据上,得到 M 个分类 loss,并更新分类网络 target network 的权重。而这 M 个分类 loss 也会收集起来,根据 Williams的REINFORCE算法拿来更新 policy network 的权重,目的是最大化分类 loss。如此迭代进行。

加入 adversarial loss 的好处可以看做是两方面:一方面是大大减少了训练所需的时间;另一方面,可以认为policy generator 在不断产生难样本,从而能帮助分类器学到 robust features,从而学的更好。

作者也可视化了学到的 policy ,如下图。可以看出随着 epoch 数量的增加,policy generator 会倾向于产生更难的数据增强 policy,如 TranslateX, ShearY and Rotate 这些几何转换会被更多使用。

ICLR2020|华为诺亚:巧妙思想,NAS与「对抗」结合,速率提高11倍

ICLR2020|华为诺亚:巧妙思想,NAS与「对抗」结合,速率提高11倍

作者的这种方法需要比较大的 batch size,一般来说大的 batch size + BN 能涨点,因此直接和 AutoAugment 比较似乎不太公平。针对这一点,如 table 4 所示,作者做了大 batch size + 随机搜索的对照实验,证明自己的搜索策略的有效性。

ICLR2020|华为诺亚:巧妙思想,NAS与「对抗」结合,速率提高11倍

此外,作者也证明了搜到的 policy 具有很好的迁移性能。如下表所示,用 ResNet 50 在 ImageNet 上搜到的 policy,换到其他模型、其他数据集上也能有不错的结果。

ICLR2020|华为诺亚:巧妙思想,NAS与「对抗」结合,速率提高11倍

个人感觉 NAS 和 adversarial loss 结合的这个 idea 是很巧妙的,在其他任务中也能借鉴。比如说搜 loss function 的时候用 adversarial loss 或许也能有不错的结果。

更多ICLR 2020信息,将在「ICLR 2020 交流群」中进行,加群方式:添加AI研习社顶会小助手(AIyanxishe2),备注「ICLR」,邀请入群。

ICLR 2020 论文解读系列:

显示全文
为您推荐
木头密度排行榜前五名 蛇纹木是密度最大的木头
木头密度排行榜前五名 蛇纹木是密度最大的木头

木头密度排行榜前五名分别为蛇纹木,东非黑黄檀,麻梨疙瘩,小叶紫檀和沙漠铁树,这五种树木的密度特别大,因此这五种木头抱起来非常的重,这也从侧面反映出了这五种木头的质量很好,很多人都选择用这五种木头做自己的家具。...

发布时间:2023-10-31 04:00:11

大型剑龙科:西部龙 体长7米(尾巴长有4个尖刺)
大型剑龙科:西部龙 体长7米(尾巴长有4个尖刺)

【导读】 大型剑龙科:西部龙 体长7米(尾巴长有4个尖刺),下面是小编为你收集整理的,希望对你有帮助!西部龙是一种大型恐龙,属于最原始的装甲亚目剑龙科恐龙,诞生于1.5亿年前的侏罗纪末期,西部龙的第一批化石是在美国怀俄明州的杰克逊县发掘的,当时这批化石正好埋藏于莫里森地层中。西部龙是一种植食性恐龙,主......

发布时间:2023-10-31 03:03:07

蒙古死亡蠕虫是什么 一种传说中巨大的毒虫(生活在戈壁滩)
蒙古死亡蠕虫是什么 一种传说中巨大的毒虫(生活在戈壁滩)

蒙古死亡蠕虫是一种传说中巨大的毒虫,据说它生活在戈壁滩中,但是自古以来有很多与之相关的目击证词,很多科学家怀疑这种生物也许真实存在。多数目击称,这种巨大毒虫有5英尺长,长相丑陋。如同牛的肠子一般,身体能够喷射毒液和释放电流以远距离捕捉猎物。...

发布时间:2023-10-31 03:02:04

河南古墓挖出活女人是真的吗?假的(没有证据证明)
河南古墓挖出活女人是真的吗?假的(没有证据证明)

【导读】 河南古墓挖出活女人是真的吗?假的(没有证据证明),下面是小编为你收集整理的,希望对你有帮助!在河南一座古墓中挖出活女人的传闻是假的,并没有真实证据佐证。这一传闻没有具体的位置和发现活女人的陵墓的具体的地点,可想而知,含糊不清的一定是假新闻。据传河南有一处千年古墓,考古学家们在将棺材打开后中,......

发布时间:2023-10-31 02:01:17

脉冲星和中子星的区别 脉冲星为什么会发出脉冲信号
脉冲星和中子星的区别 脉冲星为什么会发出脉冲信号

脉冲星和中子星在性质上几乎没有任何的区别,因为脉冲星本身就是中子星的一种,但是一般的中子星没有脉冲星那么的活泼,脉冲星能够非常有规律的向外界传输自己的脉冲信号,这一点确实显得和普通的中子星与众不同,但是在其他的方面,脉冲星和中子星几乎一致。...

发布时间:2023-10-31 02:00:15

塑料的来源和历史:1869年发明出来(是种高分子聚合物)
塑料的来源和历史:1869年发明出来(是种高分子聚合物)

【导读】 塑料的来源和历史:1869年发明出来(是种高分子聚合物),下面是小编为你收集整理的,希望对你有帮助!塑料在我们的生活中随处可见,我们用的好多东西都含有塑料,比如我们吃饭用的碗筷这些餐具里边就有塑料做成的,也有其他材质的,不过塑料碗也是相当常见的,还有好多一次性制品,一次性碗和一次性杯子,给人们带来了......

发布时间:2023-10-31 01:04:32

陆地食肉动物排名20强 这些动物令人非常胆战心惊
陆地食肉动物排名20强 这些动物令人非常胆战心惊

陆地食肉动物排名20强,分别为眼镜王蛇、银环蛇、抹香鲸、虎鲸、蓝鲸、白鲨、河马、犀牛、北极熊、熊猫、野牛、棕熊、狮子、老虎、花豹、猎豹、大猩猩、狼、大象、鳄鱼等,这些生物的战斗力在整个陆地界是最强的,如果人类没有工具的帮助,一定不是它们的对手。...

发布时间:2023-10-31 01:03:30

日本肉食恐龙:加贺龙 仅出土两颗牙齿(处于疑名状态)
日本肉食恐龙:加贺龙 仅出土两颗牙齿(处于疑名状态)

【导读】 日本肉食恐龙:加贺龙 仅出土两颗牙齿(处于疑名状态),下面是小编为你收集整理的,希望对你有帮助!加贺龙是一种兽脚亚目类恐龙,诞生于白垩纪的末期,属于肉食性恐龙的一种,最早的一批化石是在日本的加贺市发掘的,所以才以此进行了命名,但是由于出土的只有两颗牙齿化石,所以目前对它的了解并不多,加贺龙也因此......

发布时间:2023-10-31 00:04:14

列举10种有趣的自然现象 这十种自然现象令人非常好奇
列举10种有趣的自然现象 这十种自然现象令人非常好奇

世界上十种有趣的自然现象分别为指针永远指在九点钟,静电现象,手机拍照现象,自来水管里的核磁共振现象,永远不会沸腾的水现象,水的导热问题,镜子的反射问题,电磁炉的使用原理,吊扇原理以及动量守恒的反冲原理,这些有趣的自然现象经常让人捉磨不透。...

发布时间:2023-10-31 00:03:12

头发油太快什么原因 洗头太频繁会导致出油(定期换洗发水)
头发油太快什么原因 洗头太频繁会导致出油(定期换洗发水)

【导读】 头发油太快什么原因 洗头太频繁会导致出油(定期换洗发水),下面是小编为你收集整理的,希望对你有帮助!女生对于头发是非常爱护的,不喜欢别人摸自己的头发,下雨的时候相比身上别的部位,最首先护住的绝对是头发不要被打湿。这都是因为头发摸多了会出油,被雨水打湿也会出油。相比于女生来说,男生的头发更容易出油,那......

发布时间:2023-10-30 23:01:12

类星体和伽玛射线暴哪个厉害 类星体更加强大一些
类星体和伽玛射线暴哪个厉害 类星体更加强大一些

类星体比伽玛射线暴更厉害,类星体就包含伽玛射线暴物质,类星体散发出来的物质可以容纳伽玛射线暴,就是说伽玛射线暴只是类星体的一部分,伽玛射线暴对类星体产生不了什么危害。类星体除了伽玛射线暴还有很多很厉害的物质在其中,是比较厉害的物质。...

发布时间:2023-10-30 23:00:10

淮山怎么炒
淮山怎么炒

【导读】 淮山怎么炒,下面是小编为你收集整理的,希望对你有帮助!炒淮山做法:1、准备材料:淮山200克、蒜50克、青红椒50克、木耳100克、盐20克、沙茶酱两勺。2、锅内烧水,倒入淮山、蒜、青红椒、木耳,焯至八分熟。3、锅中烧油,放入蒜爆香,倒入盐、两勺沙茶酱。......

发布时间:2023-10-30 22:01:17