图像embedding训练方式_转载 | 对抗训练浅谈：意义、方法和思考（附Keras实现）...

玄玖爷

于 2021-01-22 08:22:46 发布

阅读量1.2k

点赞数 2

CC 4.0 BY-SA版权

文章标签：图像embedding训练方式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33656298/article/details/113580461

本文介绍了对抗训练的基本概念，特别是在NLP领域的应用，包括对抗样本、对抗攻击和对抗防御。文章详细讲解了快速梯度上升（FGM）方法，并提供了Keras实现的代码示例，证明对抗训练可以提高模型的泛化性能。同时，讨论了对抗训练与梯度惩罚的等价性，并给出了对抗训练的直观几何理解。实验结果显示，对抗训练能有效提升中文BERT模型在IFLYTEK和TNEWS任务上的表现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文转载自公众号：PaperWeekly (paperweekly)

整理编辑 | PaperWeekly

©PaperWeekly 原创 · 作者｜苏剑林

单位｜追一科技

研究方向｜NLP、神经网络

当前，说到深度学习中的对抗，一般会有两个含义：一个是生成对抗网络（Generative Adversarial Networks，GAN），代表着一大类先进的生成模型；另一个则是跟对抗攻击、对抗样本相关的领域，它跟 GAN 相关，但又很不一样，它主要关心的是模型在小扰动下的稳健性。

本人之前所涉及的对抗话题，都是前一种含义，而今天，我们来聊聊后一种含义中的“对抗训练”。

本文包括如下内容：

对抗样本、对抗训练等基本概念的介绍；
介绍基于快速梯度上升的对抗训练及其在 NLP 中的应用；
给出了对抗训练的 Keras 实现（一行代码调用）；
讨论了对抗训练与梯度惩罚的等价性；
基于梯度惩罚，给出了一种对抗训练的直观的几何理解。

方法介绍

近年来，随着深度学习的日益发展和落地，对抗样本也得到了越来越多的关注。

在 CV 领域，我们需要通过对模型的对抗攻击和防御来增强模型的稳健型，比如在自动驾驶系统中，要防止模型因为一些随机噪声就将红灯识别为绿灯。

在 NLP 领域，类似的对抗训练也是存在的，不过 NLP 中的对抗训练更多是作为一种正则化手段来提高模型的泛化能力。

这使得对抗训练成为了 NLP 刷榜的“神器”之一，前有微软通过 RoBERTa+ 对抗训练在 GLUE [1] 上超过了原生 RoBERTa，后有我司的同事通过对抗训练刷新了 CoQA [2] 榜单。这也成功引起了笔者对它的兴趣，遂学习了一番，分享在此。

基本概念

要认识对抗训练，首先要了解“对抗样本”，它首先出现在论文Intriguing properties of neural networks[3]之中。

简单来说，它是指对于人类来说“看起来”几乎一样、但对于模型来说预测结果却完全不一样的样本，比如下面的经典例子：

理解对抗样本之后，也就不难理解各种相关概念了，比如“对抗攻击”，其实就是想办法造出更多的对抗样本，而“对抗防御”，就是想办法让模型能正确识别更多的对抗样本。

所谓对抗训练，则是属于对抗防御的一种，它构造了一些对抗样本加入到原数据集中，希望增强模型对对抗样本的鲁棒性；同时，如本文开篇所提到的，在 NLP 中它通常还能提高模型的表现。

Min-Max

总的来说，对抗训练可以统一写成如下格式：

其中代表训练集，代表输入，代表标签，是模型参数，是单个样本的 loss，是对抗扰动，是扰动空间。这个统一的格式首先由论文Towards Deep Learning Models Resistant to Adversarial Attacks[4] 提出。这个式子可以分步理解如下：

往属于里边注入扰动，的目标是让越大越好，也就是说尽可能让现有模型的预测出错；
当然也不是无约束的，它不能太大，否则达不到“看起来几乎一样”的效果，所以要满足一定的约束，常规的约束是，其中是一个常数；
每个样本都构造出对抗样本之后，用作为数据对去最小化loss来更新参数（梯度下降）；
反复交替执行 1、2、3 步。

由此观之，整个优化过程是和交替执行，这确实跟 GAN 很相似，不同的是，GAN 所的自变量也是模型的参数，而这里的自变量则是输入（的扰动量），也就是说要对每一个输入都定制一步。

快速梯度

现在的问题是如何计算，它的目标是增大，而我们知道让 loss 减少的方法是梯度下降，那反过来，让 loss 增大的方法自然就是梯度上升，因此可以简单地取：

当然，为了防止过大，通常要对做些标准化，比较常见的方式是：

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。