- 曾诚;温超东;孙瑜敏;潘列;何鹏;
提出一种结合ALBERT预训练语言模型与卷积循环神经网络(convolutional recurrent neural network, CRNN)的弹幕文本情感分析模型ALBERT-CRNN。首先使用ALBERT预训练语言模型获取弹幕文本的动态特征表示,使得句子中同一个词在不同上下文语境中具有不同的词向量表达;然后利用CRNN对特征进行训练,充分考虑了文本中的局部特征信息和上下文语义关联;最后通过Softmax函数得出弹幕文本的情感极性。在哔哩哔哩、爱奇艺和腾讯视频三个视频平台的弹幕文本数据集上进行实验,结果表明,ALBERT-CRNN模型在三个数据集上的准确率分别达到94.3%、93.5%和94.8%,相比一些传统模型具有更好的效果。
2021年03期 v.53 1-8页 [查看摘要][在线阅读][下载 1215K] [引用频次:37 ] |[网刊下载次数:127 ] |[下载次数:1540 ] |[阅读次数:333 ] - 熊黎剑;吾守尔·斯拉木;许苗苗;
光学字符识别(optical character recognition, OCR)技术在图书数字化、文献管理等诸多领域得到了广泛应用,而相比于已十分成熟的中文、英文印刷体识别系统,小文种(维吾尔文)印刷体识别还有研究空间和实际应用需求。针对传统识别方法特征表示不足等问题,结合日益兴起的深度学习技术,采用Python语言编程,选用经改进的卷积循环神经网络作为识别算法核心,并利用Django设计系统框架。实验表明,印刷体维文识别系统的精度达到95.7%,平均速度达到12.5 fps。该系统实现了端到端的维文整词识别。
2021年03期 v.53 9-14页 [查看摘要][在线阅读][下载 2842K] [引用频次:1 ] |[网刊下载次数:77 ] |[下载次数:225 ] |[阅读次数:145 ] - 刘秀磊;孔凡芃;谌彤童;刘旭红;
航天科技开源情报文本内容较长且含有大量专有名词,影响了情报分类的效果,为了提升相关情报的分类准确率,提出一种基于BERT与XGBoost融合模型的航天科技开源情报分类算法。首先通过BERT模型的深度结构提取情报中的关键特征,然后利用XGBoost模型取代BERT最后的输出层,并依据BERT提取到的关键特征对相关情报进行分类。为了验证算法的有效性,设计了与TextRCNN、DPCNN等部分主流语言模型的对比实验,实验结果表明该算法在航天科技开源情报分类中的准确率与TextRCNN、DPCNN模型相比,分别提高了1.9%、2.2%,证明了该算法在相关分类任务中的有效性。
2021年03期 v.53 15-22页 [查看摘要][在线阅读][下载 2156K] [引用频次:9 ] |[网刊下载次数:80 ] |[下载次数:482 ] |[阅读次数:157 ] - 王宁;刘玮;兰剑;
由于法律领域知识图谱专业性强、结构复杂,而现有的关系抽取方法因各个领域的需求和术语不同,无法适用于法律领域知识图谱的构建和补全。首先,提出了基于StanfordNLP关系抽取机制的法律知识图谱构建方法;然后,构建基于设置谓语导向词的深度学习模型对法律知识图谱进行补全;最后,选用典型案例(伪卡盗刷判决书)作为文本对象验证模型的可行性。与其他知识图谱补全模型相比,本模型的准确率达到95%以上。基于谓语导向词的深度学习模型综合了自动构建和人工参与,提高了关系抽取的准确率和补全的效率,能最大程度挖掘判决书文本中的深层隐式关系,更好地发挥判决书文本的应用技术。
2021年03期 v.53 23-29页 [查看摘要][在线阅读][下载 973K] [引用频次:8 ] |[网刊下载次数:79 ] |[下载次数:1015 ] |[阅读次数:142 ] - 李靖;任丽芳;王文剑;
为了在移动环境中找到响应时间最短的组合服务,设计了一种可计算的移动模型,根据此模型过滤掉响应时间较长的组合服务,提出了移动组合服务中组件服务的选择方法。通过前馈神经网络建立组合服务与其响应时间之间的回归模型,利用基于神经网络的服务组合(neural network-based service composition, NNSC)算法选择出响应时间最短的组合服务。仿真实验结果表明,与一些启发式算法相比,NNSC算法可以找到响应时间更短的组合服务。
2021年03期 v.53 30-36页 [查看摘要][在线阅读][下载 2530K] [引用频次:1 ] |[网刊下载次数:74 ] |[下载次数:80 ] |[阅读次数:75 ] - 邓超宇;赵山;肖晓强;蔡志平;
大多数机器阅读理解模型是基于具有各种注意力机制的端到端深度学习网络,但此类模型会损失句子级别的语义信息。此外,现有数据集中的问题通常不需要复杂的推理,并且答案仅与背景段落中的少量句子相关。基于此,提出将机器阅读理解模型划分为两层:第一层用于查找段落中与问题相关的句子并生成新的背景段落;第二层则根据减小了规模的段落做进一步的答案提取。实验结果表明,在定位了相关句子后预测性能有所提高。SQuAD阅读理解数据集也被划分为两部分,以适应新的框架训练需求,并使用新的数据集测试了相关内容的长度对机器阅读理解模型效果的影响。
2021年03期 v.53 37-41+49页 [查看摘要][在线阅读][下载 1388K] [引用频次:1 ] |[网刊下载次数:88 ] |[下载次数:84 ] |[阅读次数:82 ] - 张立强;陈青松;严飞;
为了解决物联网设备中的安全隔离和隐私数据泄露问题,对类Unix操作系统线程中的信息流控制进行研究,基于ARM指针认证的硬件安全扩展和分散式信息流控制模型,通过对线程添加安全标签和完整性标签,实现进程地址空间的细粒度安全隔离,内存共享保护和安全多线程;通过内核安全原语和安全检查钩子有效防止线程间未授权的数据访问。实验结果表明,基于硬件辅助的信息流控制系统可以获得显著的性能提升,原型系统在实际的物联网程序用例(OpenSSL和Apache HTTP服务器)中,运行时内存占用增加了210 kB,平均性能开销不超过3.66%。
2021年03期 v.53 42-49页 [查看摘要][在线阅读][下载 1190K] [引用频次:2 ] |[网刊下载次数:84 ] |[下载次数:136 ] |[阅读次数:89 ] - 刘雪微;王磊;章强;王继帅;李选普;
在多光谱掌纹图像采集设备研发的基础上,提出一种基于卷积神经网络的多光谱掌纹识别方法。该方法使用ResNet-18网络对掌纹图像进行特征提取,应用特征级融合方法并将融合后的特征送入SVM分类器中进行决策。实验结果表明,所提出的多光谱掌纹识别方法可以有效提升掌纹图像特征判别效率,相比于单光谱方法和传统的神经网络算法具有更高的识别准确率。
2021年03期 v.53 50-55页 [查看摘要][在线阅读][下载 2983K] [引用频次:8 ] |[网刊下载次数:99 ] |[下载次数:380 ] |[阅读次数:81 ] - 任向阳;朱晓东;王禹博;王杰;翁政魁;
传统的图像噪声方差估计方法在处理具有较多内容变化或者丰富纹理信息的图像时,往往容易造成较大的估计偏差。提出了一种基于BM3D的图像噪声方差估计方法。首先使用传统的F-NLE噪声估计方法获取图像噪声的初步估计值,并根据噪声初步估计值生成多组噪声方差候选值;然后,使用得到的噪声方差候选值作为BM3D滤波方法的参数,对含噪图像进行滤波处理;接着,再通过多组实验对图像滤波前后的自然统计(NSS)特征差异进行分析,得出该差异能够有效地反映图像降噪效果之后,对含噪图像滤波前后的NSS特征进行提取;最后,使用获取的NSS特征对应的矢量距离,作为每幅含噪图像所对应的BM3D方法参数的权重,并利用局部均值法对图像噪声方差做出最终精确估计。通过在不同图像集上的多组实验可以得出,相比于对比方法,所提出的图像噪声估计方法具有更高的估计精度和可靠性。
2021年03期 v.53 56-64页 [查看摘要][在线阅读][下载 2022K] [引用频次:4 ] |[网刊下载次数:69 ] |[下载次数:384 ] |[阅读次数:88 ] - 王亦敬;陈荣;郭世凯;于茜;张程伟;
为了解决在未知工人效用情况下提高任务完成质量的问题,提出带有效用的最高分数匹配模型。该模型包含两个阶段:阶段一利用多臂老虎机模型计算工人效用值;阶段二利用更改了加分规则后的带有效用的基本方法(U-Basic)、带有效用的最小位置熵方法(U-LLEP)、带有效用的近距离优先方法(U-CDP)进行分配。在MovieLens和Gowalla真实世界数据集上的实验结果表明,所提方法与未使用效用的CDP和LLEP方法相比,一些评价指标有较大提升。
2021年03期 v.53 65-71页 [查看摘要][在线阅读][下载 1269K] [引用频次:2 ] |[网刊下载次数:62 ] |[下载次数:126 ] |[阅读次数:87 ] - 封硕;刘琨;
针对人工蜂群算法求解复杂优化函数时,存在收敛速度慢、算法后期种群多样性下降以及易陷入局部最优解等缺点,提出了一种融合差分进化思想的自适应人工蜂群算法。首先,引入反向学习策略初始化种群,增加种群的多样性,加强算法跳出局部最优解的能力。其次,将雇佣蜂搜索过程与差分进化算法融合,并加入自适应策略平衡算法的勘探与开发能力。最后,在侦查蜂阶段引入混沌序列,增加种群的多样性,加快算法的收敛速度。为验证本文算法的寻优性能,针对8个基准函数,选取ABC算法、DE算法、PSO算法、EABC算法、ABC/best/1算法以及本文算法分别测试。实验结果表明,本文算法在求解精度和收敛速度方面明显提高,易于跳脱局部最优解。
2021年03期 v.53 72-78页 [查看摘要][在线阅读][下载 2923K] [引用频次:6 ] |[网刊下载次数:774 ] |[下载次数:324 ] |[阅读次数:139 ] - 邵伟志;潘丽丽;雷前慧;黄诗祺;马骏勇;
在一致性正则化与熵最小化的基础上提出一种新的半监督学习算法Mean Mixup,集成数据的互补信息,然后使用熵最小化给未标记数据生成可靠的伪标签,在一致性正则化下进一步优化模型分类结果。在常用数据集SVHN和CIFAR10上对Mean Mixup算法进行了评估,实验结果表明,所提出的方法在分类准确率上优于一些已有的半监督学习算法。
2021年03期 v.53 79-84页 [查看摘要][在线阅读][下载 1979K] [引用频次:4 ] |[网刊下载次数:103 ] |[下载次数:389 ] |[阅读次数:164 ] - 黎凤洁;胡小春;陈燕;
下料问题被广泛应用于制造行业。针对制造业中大规模、多尺寸的矩形件下料问题,以材料成本和切割成本最小作为优化目标提出一种可加工性矩形件下料优化方法。通过多次迭代生成多个下料方案,选择最小的总成本作为最优解。采用递归算法生成由2个段组成T形排样方式:一段含水平条带;另一段含竖直条带,且都支持一刀切工艺。为了尽可能获得全局近似最优解,优先对大矩形件进行组合,从而提高材料利用率。对含同种矩形件的同类型条带进行共边排样生成同质块。综合考虑同质块内条带间以及矩形件间的共边切割,从而降低切割成本。实验结果证明,所提方法在保证较高材料利用率的同时,能有效减少切割刀数,对制造业中实际下料问题具有实践指导意义。
2021年03期 v.53 85-92页 [查看摘要][在线阅读][下载 1358K] [引用频次:2 ] |[网刊下载次数:65 ] |[下载次数:377 ] |[阅读次数:85 ] - 武守晓;房俊;
提出一种面向高速乱序流的top-k连续查询方法。使用基于缓存的方法等待迟到元组,但不对缓冲区内数据进行排序,通过统计运行信息实现缓存时长自适应,然后使用改造的MinTopk算法计算当前窗口的top-k结果集。实验结果表明,该方法在高速乱序流上实现了高效的top-k查询,在保证用户允许的最小正确率的情况下计算出最小缓存时长,减少了查询时延。
2021年03期 v.53 93-99页 [查看摘要][在线阅读][下载 1142K] [引用频次:2 ] |[网刊下载次数:71 ] |[下载次数:56 ] |[阅读次数:75 ]
- 王永茂;杨晓婷;
近年关于巨灾损失分布模型的研究方法多采用单一分布模型,或具有固定权重的组合分布模型。在对数广义误差分布(LogGED)的基础上,运用广义帕累托分布(GPD)拟合数据的厚尾部分,并加入可变权重组合分布模型的拟合思路,构建了可变权重的对数广义误差-广义帕累托组合分布模型(LogGED-GPD)。并对全球洪水巨灾损失进行了实证分布拟合,验证了可变权重的对数广义误差-广义帕累托组合分布模型的拟合效果更好,一定程度上为今后洪水巨灾损失的分析方法提供了参考依据。
2021年03期 v.53 100-104页 [查看摘要][在线阅读][下载 823K] [引用频次:1 ] |[网刊下载次数:62 ] |[下载次数:203 ] |[阅读次数:75 ] - 王少敏;张蒙蒙;郭燕子;陈丽花;刘宏民;
植物激素在调节植物生长和发育过程中起着重要作用。首次建立了同时分析地黄叶片和块茎中脱落酸、水杨酸、吲哚乙酸、赤霉素和玉米素等5种植物激素含量的液相色谱-质谱法。目标植物激素在线性范围内的相关系数范围为0.995 9~0.999 2,方法检出限范围为0.013~0.038μg/mL,定量限范围为0.043~0.127μg/mL。日内相对标准偏差范围为1.7%~3.2%,日间标准差范围为3.0%~10.5%。地黄叶片和块茎中5种植物激素的回收率范围分别是81.9%~106.7%和78.4%~96.7%。接着利用此方法分析了不同地黄生长期中叶片和块茎中目标植物激素含量的变化特征,这将有助于了解这些植物激素在地黄生长和发育中的作用。
2021年03期 v.53 105-109+126页 [查看摘要][在线阅读][下载 910K] [引用频次:0 ] |[网刊下载次数:74 ] |[下载次数:270 ] |[阅读次数:74 ] - 郭嘉琦;蒋建东;
为准确评估大容量工业负荷接入对电网造成的电能质量影响,提出了一种可变模糊云模型电能质量综合评估方法。首先建立电能质量评估指标体系,使用模糊层次分析法与变异系数法的结果计算主客观综合权重,通过加权的方式反映多指标对评估的影响。根据可变模糊集思想,将样本数据对限值区间的相对隶属度作为加权平均的权值,改进逆向云模型特征值计算方法,使用正向云模型确定电能质量标准等级云模型。在得到电能质量标准等级云模型与样本数据云模型的基础上,计算云相似度得到电能质量评估等级。最后以典型负荷电弧炉为例,进行电能质量综合评估,验证了方法的准确性和有效性。
2021年03期 v.53 110-118页 [查看摘要][在线阅读][下载 1290K] [引用频次:12 ] |[网刊下载次数:61 ] |[下载次数:327 ] |[阅读次数:173 ] - 王贵春;曹宗恒;
斜拉索为细长结构,其阻尼比较小,容易发生涡激振动。为研究斜拉索涡激振动响应特性,结合CFD方法和重叠网格技术,对斜拉索二维模型进行了研究。利用CFD软件Fluent求解二维不可压缩黏性流体Navier-Stokes方程,并通过Fluent提供的UDF接口,嵌入自编Newmark-β法程序,求解两自由度结构动力响应方程。研究结果表明:相较于低质量比涡激振动响应,斜拉索涡激振动振幅较低,但其可能造成的疲劳破坏不容忽视;斜拉索涡激振动的锁定区间很短,对风速的变化比较敏感;斜拉索运动轨迹也更加丰富,不再是单一的"8"字形运动。
2021年03期 v.53 119-126页 [查看摘要][在线阅读][下载 2567K] [引用频次:8 ] |[网刊下载次数:79 ] |[下载次数:250 ] |[阅读次数:83 ] 下载本期数据