对抗环境下的情感分析模型

我要开发同款
proginn12301709912023年12月13日
57阅读
开发技术自然语言处理、机器学习、深度学习
所属分类情感分析、对抗防御、NLP、文本分析

作品详情


众所周知,深度神经网络在自然语言处理中常常面临各种类型的对抗攻击,尤其是针对单词级别的攻击。
近年来,研究者们针对词级攻击提出了多种防御策略,但大部分策略主要关注同义词替换这一类型的攻击。然而,词级攻击并不局限于同义词替换。
为了更全面地应对词级对抗攻击,本文提出了一种基于语义联想场的文本嵌入方法。
具体而言,我们首先分析了人类能够识别并理解经过扰动的文本对抗样本的关键原因,发现两个关键点:
1)原始单词与被扰动的单词之间存在一定的语义联系;
2)这种联系使得人类能够通过联想推断出原始单词。
基于以上观察,我们引入了语义联想场的概念,并提出了一种新的防御方法。该方法通过构建一个鲁棒的词嵌入空间来计算词向量。
具体来说,我们将相关的词向量与势函数和加权嵌入采样相结合,以模拟同一语义场中词之间的语义影响。
本文进行了全面的实验,验证了所提出的方法在各种对抗性攻击和原始测试集下,相较于基线防御方法具有更高的精度。
此外,该方法具有通用性,与模型结构无关,且几乎不影响训练效率。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论