Current position: Home >> Scientific Research >> Paper Publications
Chen Yewang

Personal Information

Supervisor of Master's Candidates  

Paper Publications

基于百度百科与文本分类的网络文本语义主题抽取方法

Hits:

Journal:小型微型计算机系统

Place of Publication:中国科学院沈阳计算技术研究所

Key Words:百度百科,语义主题,主题抽取,语义离散度

Abstract:网络上存在海量中文文本资源,其中许多具有稀疏性与不规范性,难于处理与挖掘. 百度百科是一个丰富的与社会热点、网络流行紧密相关的动态中文知识库,基于百度百科本文提出一种网络文本语义主题抽取方法.首先利用百度百科的知识关系将文本映射到侯选语义主题空间中,根据训练数据进行分类,找出最大可能的分类,选出属于该分类的候选语义主题.最后提出根据语义离散度确定最终语义主题.在两个数据集上的实验结果表明,该方法不仅对网络不规范文本而且对于规则文本都具有较好的语义主题抽取性能.

Page Number:2605-2610

Number of Words:71770000

Translation or Not:no

Date of Publication:2011-11-02

First Author:CDS,LHB,ZBN,Huazhen Wang,Chen Yewang

Pre One:一种基于本体与描述文本的网络图像语义标注方法

Next One:一种基于稀疏编码的语义标注方法