English

 

 

   
   
   
简要介绍  
历史沿革
新闻公告
 
 
 
 

 

   

概况 - 新闻公告

 

 

 

   

    实验室3篇论文被Interspeech2016录用,如下:
   

    [1] Li M, He Z, Wu J. Target-based state and tracking algorithm for spoken dialogue system[C]//Seventeenth Annual Conference of the International Speech Communication Association. 2016 内容:传统的口语对话系统使用框架结构表示对话状态,在本文中,我们认为使用目标分布表示对话状态是一种更好的选择。根据本文提出的基于目标分布的状态定义,对两种目标分布状态跟踪算法进行了研究。我们在完整对话系统上与真实用户进行了对话实验,结果表明基于目标分布的状态跟踪算法可以有效地处理理解结果的不确定性,显著提升了系统对话成功率。
    [2] Li M, Chen Z, Wu J. Improving The Probabilistic Framework for Representing Dialogue Systems with User Response Model[C]//Seventeenth Annual Conference of the International Speech Communication Association. 2016. 内容:针对目标驱动的口语对话系统,我们提出了描述对话过程的概率框架。在概率框架中,使用目标分布表示对话状态,基于目标分布的状态跟踪算法可以很好的处理对话过程中的不确定性;通过结合数据库信息对目标分布对话状态进行总结,可以得到更加高效的对话策略。本文对概率框架中的用户响应模型进行了研究,讨论了引入用户响应模型后的对话策略优化。在模拟对话场景和真实对话场景下的实验表明,尽管根据先验知识得到的用户响应模型和真实用户表现有所差别,但是我们提出的修正后的对话策略表现出了鲁棒的、高效的性能。结果也进一步说明了我们提出的概率框架的扩展能力。
    [3] Zhang T, Chen Z, Wu J. Objective evaluation methods for Chinese Text-To-Speech systems[C]//Seventeenth Annual Conference of the International Speech Communication Association. 2016. 内容:本文提出了一种针对语音合成系统的客观评价方法。传统对于语音合成系统性能的评估主要使用人工的方法,我们使用机器学习的相关理论,通过子空间分解来获取语音中包含的不同信息,并使用一个成对比较的支持向量机对合成语音的质量能够进行评估。我们在10个不同的语音合成系统上进行了轮转测试,最终的排序相关度达到了0.9115,显著提升了语音合成系统客观评价方法的性能,验证了子空间分解方法在合成语音的质量评估中的作用和前景。

     

 

 

 

 

 

 

 
     
 
 

清华大学 | 信息科学技术学院 | 电子工程系 | 科大讯飞

 
 

版权所有:清华大学电子工程系多媒体信号与智能信息处理实验室