Northwestern Polytechnical
University
Audio Speech & Language Processing Group
Digital Signal Processing
  • English
Home
您是第counter free hit unique web位访客

首页»新闻»正文

Wireless Communications Speech Processing Medical Applications

实验室师生赴澳大利亚参加ICASSP2015国际会议

       2015年4月19-24日,实验室谢磊教授与研究生樊博同学参加了在澳大利亚布里斯班召开的第四十届IEEE声学、语音与信号处理国际会议(ICASSP2015)。该会议是由IEEE发起的、世界上最大的也是最全面的关于数字信号处理及其相关应用的技术性学术大会,也是语音研究两大顶级会议之一。此届会议在布里斯班国际会议中心举办,由昆士兰大学承办,参会人员超过1700多人。涉及领域主要包括有:音频与声学信号处理(Audio and acoustic signal processing)、生物成像及信号处理(Bio-imaging and signal processing)、语音处理(Speech processing)、信号处理相关的机器学习(Machine learning for signal processing)、多媒体信号处理(Multimedia signal processing)、传感器阵列和多通道信号处理(Sensor array & multichannel signal processing)、图像、视频及多维信号处理(Image, video & multidimensional signal processing)、口语语言处理(Spoken language processing)等诸多领域。
     此次大会邀请了5位世界著名学者做了大会特邀报告,17个tutorial,149个口头和海报sessions,并且新增加了针对学生和青年学者的ICASSP School,由领域专家讲授领域的发展历史和综述。
     此次盛会上,实验室共展示了两篇论文,其中一篇是与微软亚洲研究院语音组合作在逼真面部动画上的成果,题目是:PHOTO-REAL TALKING HEAD WITH DEEP BIDIRECTIONAL LSTM,由论文第一作者樊博同学进行了报告,该论文采用深度双向长短时记忆回归神经网络(BLSTM-RNN)进行从文本到面部动画的预测,效果超越了传统的基于隐马尔科夫模型的方法。该研究成果引起了学术界和工业界的浓厚兴趣,IEEE信号处理协会主席(IEEE Signal Processing Socieity President)、苹果公司Siri高级主管(Sr. Director, Siri at Apple)对该成果给予了高度的关注。另外一篇论文是实验室在基于样例的关键词检出(Query-by-example Spoken Term Detection, QbE-STD)上的最新研究成果,该成果是实验室与合作伙伴新加坡南洋理工大学(NTU)、新加坡资讯通讯研究院(I2R)合作完成,是对去年联合参加MediaEval2014 QUESST国际评测的总结。在去年的QUESST国际评测中,实验室与NTU、I2R联合参加评测,获得了总成绩第二、T3评测第一名的好成绩。
     此次会议也受到了工业界的普遍关注,会议上汇聚了语音领域相关的世界顶级企业参展和交流,包括微软、百度、Google、Amazon、Facebook、IBM、Nuance、Mathworks等。Google此次派出参会的人数在所有参会单位中排名第三,仅其一家就为会议贡献了20余篇论文,语音行业达到一个高速发展的时期。
     据悉,ICASSP2015会议之后,谢磊教授应邀访问了澳大利亚卧龙岗大学、悉尼大学与悉尼科技大学相关实验室,进行了学术报告,与对方探讨了技术合作。

     实验室发表的论文:

Bo Fan, Lijuan Wang, Frank K. Soong and Lei Xie, Photo-real Talking Head with Deep Bidirectional LSTM, ICASSP2015, 19-24 April 2015, Brisbane, Australia PDF


Haihua Xu, Peng Yang, Xiong Xiao,Lei Xie, Cheung-Chi Leung, Hongjie Chen, Jia Yu, Hang Lv, Lei Wang, Su Jun Leow, Bin Ma, Eng Siong Chng, Haizhou Li, Language Independent Query-by-Example Spoken Term Detection using N-Best Phone Sequences and Partial Matching,ICASSP2015, 19-24 April 2015, Brisbane, AustraliaPDF

 

 

 

 

  • 校园风光