基于中文WordNet的中英文词语相似度计算Chinese and English Word Similarity Measure Based on Chinese WordNet
吴思颖;吴扬扬;
摘要(Abstract):
介绍一种基于中文WordNet的中英文词语相似度计算方法.在WordNet同义词集的上下位关系图中,引入了距离、密度、深度3个因素来估计同义词集之间的相似度,采用一个自适应的方案来解决候选同义词集组合的权重和取舍问题.实现了一个可以计算英-英、汉-英、汉-汉词语之间相似度的算法,所得结果比较符合人们对词语的理解.
关键词(KeyWords): 中文WordNet;词语相似度;语义相似度
基金项目(Foundation): 福建省科技计划重点项目,编号2008I0021;; 福建省自然科学基金资助项目,编号2009J01289
作者(Authors): 吴思颖;吴扬扬;
参考文献(References):
- [1]荀恩东,颜伟.基于语义网计算英语词语相似度[J].情报学报,2006,25(1):43-48.
- [2]Sebti A,Barfrous A A.A new word sense similarity measure in WordNet[C]//Proceedings of the International Multi-conference on Computer Science and Information Technology.Washinton D C:IEEE Computer Society,2008:369-373.
- [3]Hirst G,St-Onge D.Lexical chains as representations of context for the detection and correction of malapropisms[M]//WordNet:an Electronic Lexical Database.Cambridge M A:MIT Press,1998.
- [4]Resnik P.Using information content to evaluate semantic similarity in a taxonomy[C]//Proceedings of the 14th Interna-tional Joint Conference on Artificial Intelligence.San Francisco:Morgan Kaufmann Publishers Inc,1995:448-453.
- [5]刘群,李素建.基于《知网》的词汇语义相似度计算[J].计算语言学及中文信息处理,2002,7(2):59.
- [6]张承立,陈剑波,齐开悦.基于语义网的语义相似度算法改进[J].计算机工程与应用,2006,42(17):165-166.