公众号

网站访问量
基于改进ConvNeXt Block的新型双域融合图像隐写
段新涛;徐凯欧;白鹿伟;张萌;保梦茹;武银行;秦川;针对图像隐写中不可感知性差、安全性不足和隐写容量低的问题,提出一种基于改进ConvNeXt Block的新型双域融合图像隐写方案。首先,改进后的深度可分离卷积模块可以学习到更为细节的图像特征信息。其次,设计一种新型的空间域和频域信息融合方式来提高图像的不可感知性和安全性。最后,采用多个损失函数对网络进行级联约束。实验结果表明,相比其他隐写方案,所提方案在峰值信噪比上平均提高3~4 dB,结构相似性和学习感知图像块相似度的平均值分别为0.99和0.001;抗隐写分析能力更接近50%,具有更高的安全性,且大容量隐藏时仍具有较好效果。
不确定性感知的标签噪声矫正算法
李英双;贾文玉;杨莉;曾旺官;董永峰;标签噪声通过在训练过程中降低对真实类别预测的置信度引入了不确定性问题,为了降低标签噪声的影响,提出了一种不确定性感知的标签噪声矫正算法(ULC)。首先,基于证据理论和主观逻辑理论,从样本的多个视图和标签信息中估计不确定性。其次,采用双准则样本选择策略将数据集划分为三个子集,并使用联合预测矫正噪声标签。最后,采用不同的正则化策略处理各个子集以优化训练目标。在四个模拟标签噪声数据集和两个真实标签噪声数据集上进行对比实验。与DivideMix算法相比,在包含40%Pairflip类型噪声的CIFAR-10和CIFAR-100数据集上,ULC的分类准确率分别提升了10.58个百分点和15.84个百分点,矫正标签准确率分别达到了95.48%和81.32%。实验结果表明,ULC能够准确估计不确定性,提升矫正标签准确率和模型泛化性能。
一种融合双曲表示与欧几里得表示的源代码漏洞检测方法
陈旭;陈子雄;景永俊;王叔洋;宋吉飞;随着软件系统的日益复杂,源代码漏洞检测成为维护软件安全的关键任务。虽然现在已有各种基于深度学习的漏洞检测方法,但这些方法主要依赖单一的欧氏空间视角提取代码表示结构中的语义特征与结构特征,这不利于检测隐藏在代码深处的漏洞。为了解决这一问题,提出一种融合双曲表示与欧几里得表示的源代码漏洞检测方法(source code vulnerability detection method fusing hyperbolic representation and Euclidean representation, VulDEHGCN),在两种不同的空间对源代码进行嵌入处理,以不同视角挖掘源代码的漏洞特征,实现更准确的漏洞检测。实验结果表明,与现有的漏洞检测方法相比,VulDEHGCN在准确率、精确率、召回率和F1得分等关键性能指标上均实现了显著提升,其中,准确率和F1分数分别达到98.93%和96.63%。消融实验还证实了融合不同视角的代码嵌入的检测性能更优。
基于改进GraphSAGE的网络攻击检测
闫彦彤;于文涛;李丽红;方伟;基于深度学习的网络攻击检测是对欧几里得数据进行建模,无法学习攻击数据中的结构特征。为此,提出一种基于改进图采样与聚合(graph sample and aggregate, GraphSAGE)的网络攻击检测算法。首先,将攻击数据从平面结构转换为图结构数据。其次,对GraphSAGE算法进行了改进,包括在消息传递阶段融合节点和边的特征,同时在消息聚合过程中考虑不同源节点对目标节点的影响程度,并在边嵌入生成时引入残差学习机制。在两个公开网络攻击数据集上的实验结果表明,在二分类情况下,所提算法的总体性能优于E-GraphSAGE、LSTM、RNN、CNN算法;在多分类情况下,所提算法在大多数攻击类型上的F1值高于对比算法。
基于GAN和元学习的伪装流量生成模型
邹元怀;张淑芬;张祖篡;高瑞;马将;基于深度学习的恶意流量检测模型容易受到对抗攻击的影响,为了发掘此类模型的安全漏洞并找到提高其鲁棒性的方法,提出一种对抗样本生成模型ReN-GAN。该模型基于生成对抗网络原理,能够根据流量特征自动生成相应伪装流量并利用对抗样本可迁移性实现黑盒攻击。通过引入动量迭代方法和添加扰动的约束机制,在保证原始流量功能性的同时提高了伪装流量对抗样本的泛化能力。在训练过程中结合元学习理论进行优化,使得目标集成模型能够更有效地捕捉各模型的共同决策边界,提高了生成对抗样本的可迁移性。实验结果表明,ReN-GAN模型在保持原始流量特性的前提下,生成的对抗样本在黑盒检测模型上的平均逃逸率达到了54.1%,且比其他方法显著缩短了生成时间。此外,在以基于DNN的分类器为攻击目标进行训练时,ReN-GAN模型仅需5次迭代即可生成逃逸率为62%的伪装流量,大幅减少了交互次数。
基于EALMDA的医疗命名实体识别数据增强方法
道路;刘纳;郑国风;李晨;杨杰;医疗命名实体识别是从非结构化医疗文本中识别命名实体,在许多下游任务中起重要作用。医疗命名实体的复杂性需要专家利用领域知识进行标注,导致医疗领域存在严重的标注数据稀缺问题。为解决该问题,提出了一种基于实体感知掩码局部融合命名实体识别数据增强(entity aware mask local mixup data augmentation, EALMDA)方法。首先,使用实体感知掩码通道提取关键元素并掩码非实体部分,以保留核心语义。其次,通过上下文实体相似度和k近邻两种采样策略的线性组合对掩码句子进行融合,保留核心语义的同时增加样本的多样性。最后,经序列线性化操作后,将句子输入生成的模型中得到增强样本。在NCBI-disease等五个主流医疗命名实体识别数据集上,模拟低资源场景与主流的数据增强基线方法进行对比实验,所提方法的性能相比基线方法有显著提升。