郑州大学学报(理学版)

2016, v.48(03) 63-68

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Archive) | 高级检索(Advanced Search)

基于半监督DPMM的新闻话题检测
News Topic Detection Based on Semi-supervised DPMM

姚冬冬,袁方,王煜,刘宇

摘要(Abstract):

基于狄利克雷过程混合模型(DPMM)这一非参数贝叶斯生成模型,从语义的角度入手,结合其自动确定聚类个数的特性进行话题检测,运用了聚类个数K值由大到小变化的采样策略,通过逐层递进的形式获取到较为准确的K值,并在此基础上对语义聚类的词频特性加以分析,引入一组名词实体作为"热点特征词"来引导聚类过程,从而给出了DPMM半监督模型.实验结果表明,所给出的话题检测方法在TDT4语料上取得了较好的检测性能.

关键词(KeyWords): 话题检测;狄利克雷过程;Gibbs采样;幂律特性;名词实体

Abstract:

Keywords:

基金项目(Foundation): 河北省软科学研究计划项目(12457206D-11,13455317D)

作者(Author): 姚冬冬,袁方,王煜,刘宇

DOI: 10.13705/j.issn.1671-6841.2016070

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享