郑州大学学报(理学版)

2023, v.55(01) 15-20

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于改进TextRank的关键句提取方法
The Method of Key Sentence Extraction Based on Improved TextRank

陈梦彤;谷晓燕;刘甜甜;

摘要(Abstract):

在进行文本挖掘时,通常根据关键词分析文本,这种方式容易忽略词语之间的关联性,影响文本挖掘的准确性。TextRank算法是提取关键词或者摘要的主要方法,该算法基于网络图考虑了句子间相似性,但是忽略了词语的特征。基于此,提出了一种改进TextRank算法,将相似语句合并后,考虑多种词特征进行关键句选取。首先,计算语句相似度,并且去除文中相似性较高的语句;然后,根据词频、词义、词位置对词语打分,构建有向图;最后,计算语句平均得分进行排序,选出关键句。实验结果表明,改进后的算法准确性优于其他算法,算法的时间复杂度降低,并且解决了关键词对文本描述片面和摘要烦琐的问题。

关键词(KeyWords): 关键句提取;改进TextRank算法;相似句合并;词特征

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金项目(71701020);; 国家重点研发计划项目(2019YFB1405003);; 北京市社科项目(19YJB015)

作者(Authors): 陈梦彤;谷晓燕;刘甜甜;

DOI: 10.13705/j.issn.1671-6841.2021394

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享