郑州大学学报(理学版)

2010, v.42(02) 61-65

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Archive) | 高级检索(Advanced Search)

基于类别相关性和交叉熵的特征选择方法
Feature Selection Method Based on Category Correlation and Cross Entropy

朱颢东,钟勇

摘要(Abstract):

文本分类首先要解决的一个问题就是特征选择.简单分析了几种经典的特征选择方法,总结了它们的不足,提出了一个类别相关性方法,把交叉熵引入粗糙集并提出了一个基于交叉熵的属性约简算法,把该属性约简算法同类别相关性方法结合起来,提出了一个综合的特征选择方法.该方法首先利用类别相关性方法进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明,此特征选择方法效果良好.

关键词(KeyWords): 文本分类;特征选择;类别相关性;交叉熵;属性约简

Abstract:

Keywords:

基金项目(Foundation): 四川省科技计划项目,编号2008GZ0003;四川省科技厅科技攻关项目,编号07GG006-014

作者(Author): 朱颢东,钟勇

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享