陈叶旺Chen Yewang

硕士生导师

性别:男

学历:博士研究生

学位:理学博士学位

入职时间:2009-08-11

办公地点:机电实验大楼 A409

电子邮箱:

在职信息:在岗

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

一种基于稀疏编码的语义标注方法

发表时间:2010-12-09 点击次数:

发表刊物:计算机科学
关键字:本体,语义标注,段落结构,SAMSC
摘要:语义标注是实现语义网的一个重要研究内容,目前已有很多标注方法取得了不错的效果。但这些方法几乎没有注意到本体所描述的知识往往稀疏地分布在文档中,也未能有效地利用文档的组织结构信息,使得这些方法对质量较差的文档标注结果不理想。本文提出了一种基于稀疏编码的本体语义自动标注方法(Semantic Annotation Method based on Sparse Coding: SAMSC)。该方法先按本体知识描述从文档中识别出一定的语义作为初始值,再通过迭代解析文档段落结构和描述主题,完成本体知识与文档资源的相关系数矩阵计算;最后在全局文档空间中通过最小化损失函数来实现用本体对文档的语义标注。通过实验,表明该方法能有效地对互联网中大量良莠不齐的文档进行自动语义标注,对质量差的文档资源能取得让人接受的结果.
页面范围:150-155
是否译文:
发表时间:2010-12-09
第一作者:陈维斌,余金山,李海波,陈叶旺