基于改进的PageRank的网页信息可信度评估方法A Credibility Evaluation Method for Web Information Based on Improved PageRank
马伟瑜,袁方
摘要(Abstract):
提出了一种基于改进的PageRank的网页信息可信度评估方法,该方法既考虑了网页间的交互结构,也考虑了网页信息主题间的语义关系.由于网页信息内容具有不同的发布时间,在进行可信度评估过程中,还引入了时间衰减函数,从而反映时间这一要素的影响.实验结果表明,所提出的可信度评估方法是有效的,可以为用户提供可信度较高的网页.
关键词(KeyWords): 网页信息可信度;PageRank;相关度;时间度
基金项目(Foundation): 河北省教育厅科学研究重点资助项目,编号ZH200804
作者(Author): 马伟瑜,袁方
参考文献(References):
- [1]Gulli A,Signorini A.The indexable Web is more than 11.5 billion pages[C]//Proceedings of the 14th International Con-ference on World Wide Web.Chiba,2005:902-903.
- [2]Silverstein C,Henginger M,Marais J,et al.Analysis of a very large AltaVista query log[J].SIGIR Forum,1998,33(14):6-12.
- [3]艾静,王仲远,孟小峰.C-Rank:一种Deep Web数据记录可信度评估方法[J].计算机科学与探索,2009,3(6):585-593.
- [4]Abdul-Rahman A,Hailes S.Relying on trust to find reliable information[C]//Proceedings of Symposium on Database,Web and Cooperative Systems(DWA-COS’99).Baden-Baden,1999.
- [5]Brin S,Page L.The anatomy of a large-scale hypertextual Web search engine[C]//The 7th Int’l WWW Conference.Brishane,1998:107-117.
- [6]王向阳,马军.一个基于PageRank的科技文献质量评价算法[J].广西师范大学学报:自然科学版,2009,27(1):165-168.
- [7]杨小平,丁浩,黄都培.基于向量空间模型的中文信息检索技术研究[J].计算机工程与应用,2003,40(15):109-111.
- [8]Kawai Y,Fujita Y,Kumamoto T.Using a sentiment map for visualizing credibility of news sites on the Web[C]//Pro-ceedings of WICOW 2008.California,2008:53-58.
- [9]张岭,马范援.加速评估算法:一种提高Web结构挖掘质量的新方法[J].计算机研究与发展,2004,41(1):98-103.
- [10]Hassan A,Fader A,Crespin M H,et al.Tracking the dynamic evolution of participant salience in a discussion[C]//Pro-ceedings of the 22nd International Conference on Computational Linguistics.NJ:Association for Computational Linguis-tics,2008:313-320.