English

 

 

   
   
   
简要介绍  
历史沿革
新闻公告
 
 
 
 

 

   

概况 - 新闻公告

 

 

 

    实验室论文Zhiyang He, Ji Wu, Tao Li." Label Correlation Mixture Model: A Supervised Generative Approach to Multilabel Spoken Document Categorization." 被IEEE Transactions on Emerging Topics in Computing录用。

    论文的主要内容为:多标签文本分类问题是比传统的文本二分类或多分类问题更加困难但也更加实际的问题,近些年来也得到了很大关注。为了刻画多标签文档的生成过程,本文提出了标签相关混合模型(label correlation mixture model),该模型属于概率生成模型,可以被用于解决多标签口语文档分类问题以及多标签文本分类问题。对于标签相关混合模型,标签和主题是一一对应的。标签相关混合模型包含两个重要组成部分:标签相关模型和已知多标签条件下的文档模型。标签相关模型主要用于描述标签的生成过程,其中标签之间的相关性也同样被考虑。本文也提出了一种高效算法用以估计任意给定的标签组合的生成概率。多标签条件下的文档模型可以看作是标签已知的有监督标签混合模型。每一个标签用一个词分布来建模。对于其参数学习,在最大似然估计准则的基础上,本文也提出了一种基于最小分类错误的区分性训练准则用以学习模型参数。为了评估标签相关混合模型的性能,本文在一个口语文档集合和三个标准文本集合上进行了多标签分类的实验。与其它方法的实验结果对比证明了标签相关混合模型的有效性。

 

 

 

 

 

 

 

 

 

 

 

 

 
     
 
 

清华大学 | 信息科学技术学院 | 电子工程系 | 科大讯飞

 
 

版权所有:清华大学电子工程系多媒体信号与智能信息处理实验室