结合语义理解的语音识别技术和深度学习技术

Slides:

Advertisements

Similar presentations

定格入格破格 —— 新诗仿写复习训练仿照下列句子，再把 “ 人生 ” 比喻成 “ 大海 ”“ 天空 ” ，造两个句子。如果说人生是一首优美的乐曲，那么痛苦则是其中一个不可或缺的音符。参考答案： 1 、如果说人生是一望无际的大海，那么挫折则是其中一个骤然翻起的浪花。 2 、如果说人生是一片湛蓝的天空，那么失意则.

Advertisements

我国国有银行资本构成及资本充足率变化小组成员：金融尹佳裕王淼刘钰金融吴昱.

昆明机场. 目录  机场历史机场历史  建设状况建设状况  运行状况运行状况  航线航线.

第十四章人口（二）高中地理（一）. 第一節人口成長第二節人口組成第三節人口問題第十四章人口（二）

中國歷史社會主義文化大革命我們的報告是關於中國著名的革命 —— 文化大革命。你可會立即想到它何時發生、怎麼會發生等等。我們將會介紹文化大革命，希望你細心欣賞。

党课讲座入党的条件与程序.

中國大陸教育督導制度探究凌林煌教授/博士講授國立中山大學共同科歷史學程

计算机组成原理.

温故知新犬　戎公元前 770年周平王公元前771年东周洛邑西周镐京.

让我们走进秋天.

客房備品管理新竹老爺大酒店客房部協理邱建銘.

小组成员：范静静、郑明、郑羽竹、金睿、杨阳、姜萌、潘亚伟

三本小说比较——三位小说家笔下的故事发展

第一章教育与教育学讲授提纲教育与教育学思考题目主讲：白彦茹（教授）阅读文献教学目的与要求教学重点与难点退出.

我国政府受人民的监督权力的行使：需要监督.

第二冊第五課　行政法與生活師大附中陳采妍.

鹽酥蝦蝦子先處理好蝦頭剪至眼睛處，鬚及蝦頭的小腳也都剪乾淨 2 再用廚房用剪刀開背去腸泥

第四节 K线图研判技巧.

大规模深度学习算法 Deep Belief Network及其应用

农业银行网上签约流程宁夏金溢投资内部资料 1.

廉政會報專題報告農地重劃工程施工常見缺失報告：吳東霖製作：張昌鈴日期：103年12月23日.

以语言输出为驱动，培养学生的英语演讲能力

專案製作經驗談.

关于在宝钢全体党员中开展“学党章党规、学系列讲话，做合格党员”学习教育的实施方案

More『2』莊園 1+1 MORE 2 的秘密.

上海万科2010年新品发布会策划案 2010年8月31日.

小學四年級常識科食物的消化.

旅游资源赏析.

道路交通事故處理.

前言１．课程安排：第一章操作系统引论（7学时）第二章进程管理（14学时）第三章处理机调度与死锁（10学时）

旅游心理学模块三项目二任务四旅游者的气质.

第一节房地产开发概述第二节房地产开发程序第三节房地产开发建设管理第四节房地产开发的可行性研究

金門縣重大空難應變機制-消防局壹、消防搶救、滅火、緊急救護一、派遣作為：

2103年杨浦科技园区运动会策划方案.

心跳加快安靜且無發燒時，心跳每分鐘120次以上肌躍型抽搐 (睡眠中無故驚嚇/突然間肌肉收縮)

高中地理（一）第十六章產業（二）林、漁、礦業.

第七章 人口第一節種族的分布與現況第二節人口結構與成長第三節人口問題總目錄.

关于全国高校数学微课程教学设计竞赛林亚南 2015年12月12日.

基隆市立八斗高中 102 學年度第二學期 402 班『親師座談』

第三章　文学作为活动.

宗教故事 Back >> 【被逐出樂園】米開朗基羅1508~12年.壁畫

設計者：台中縣永隆國小王慶祥老師主講者：高雄市光華國小洪秋龍主任日期：2003/11/08

影帝有很多个，而歌神就只有一个.

升學應選擇符合自己性向、興趣或能力的學校就讀，有五專、高職、高中、綜合高中或進修學校，可要多花些時間了解一下哦！

2.4 民主监督—— 守望公共家园.

立體圖形、圖形變換、空間第十一組廖芳苓葉玟孝林佩君.

視野死角與內輪差埔心國小交通安全團隊.

交換生說明會 101學年度下學期 (2013年春季學期) 2013年2月18日 (工程一館106室)

第1章电脑的硬件组成本章要点拆卸电脑 PC的基本构成主机箱内的主要部件电脑主机箱背面的接口主要配件的外观.

第4章作業系統的介紹及操作.

第十三章電腦病毒(Computer Virus)

教學意見網路調查填答說明填答說明教務處 102年12月.

雨後的濕地夜晚的落葉層清晨的姑婆芋下你可能曾經和這個小精靈錯身而過…… 遇見蝸牛百分百《蝸牛不思議》／遠流出版.

南瑞学堂学员简明操作指南上海时代光华教育发展有限公司 2013年.

sequence-to-sequence

CISC vs. RISC 複雜指令集電腦(Complex Instruction Set Computer: CISC)

Advanced word vector representations

第十讲刘少奇与中国革命和建设.

第11章神经网络.

使用服务平台办理离校操作指南.

2019/4/29 计算机组成原理辅导教师：陆明强.

105學年度服務學習教育說明會 Service Learning.

学年第一学期领取教材明细查询的通知学年第一学期学生使用的教材均在网上平台公示。现将有关事项通知如下：

项目一了解计算机项目二选配计算机硬件项目三组装计算机项目四设置BIOS和硬盘分区项目五安装操作系统和常用软件

生命教育媒材應用分享電影天外奇蹟(UP) 華盛頓高中巫孟容.

欠拟合与过拟合龙沛洵

Speaker : YI-CHENG HUNG

小組製作人介紹 2 年 14 班 21 號高嘉駿 2 年 14 班 20 號林宏恩 2 年 14 班 14 號林立仁.

景文科技大學學生校外實習訪視暨差旅費核銷說明

Presentation transcript:

结合语义理解的语音识别技术和深度学习技术百度语音技术部贾磊 2013.8.01

. . . 通用语音识别服务简介声学训练数据语言训练返回识别结果/命令个人用户账号信息个人账号分享信息任务调度模块声学模型语音压缩无线网络网络接口协议 . . . 声学训练数据语言训练语言模型自适应解码器识别结果返回返回识别结果/命令语言模型个人用户账号信息个人账号分享信息解码空间组织和构建任务调度模块端点检测手机本地解析声学模型输出分布 DNN 语音服务内容 … …

识别文字结果，输入query种类，指令内容解析一套解码器支持多种应用 ( 统一入口技术) 百度搜索好123 手机地图百度应用百度音乐手机浏览器输入法语音助手手机指令统一构架交互入口融合Grammer 和 Ngram信息的解码空间类语言模型，Grammer模型，Ngram模型深度神经网络模型一遍解码识别文字结果，输入query种类，指令内容解析

互联网下的语音识别的技术挑战 1. 网络化的识别构架海量的来自各种终端的声学语料和声学模型的个性化自适应 1. 网络化的识别构架海量的来自各种终端的声学语料和声学模型的个性化自适应海量的来自各种渠道的文本语料和语言信息的快速更新 4. 语义理解和语音识别紧密相关，语音识别和互联网服务紧密相关 5. 语音识别服务计算资源耗费严重数据增加算法性能提升

分布式语言模型分块高速训练(1) 倒数第二个词是W2的后缀树的直接快速抽取递归的后缀树排序语料语料1 +索引网络传输语料2 语料3 。。。 CPU Kernel1 CPU Kernel2 CPU Kernel3 递归的后缀树排序语料 +索引倒数第二个词是W2的后缀树的直接快速抽取网络传输基于树合并的归并排序

融合语义解析的声学空间网络词典自跳转 Grammer：打电话给【人名】发短息给【人名】说【短信内容】从【地名】到【地名】怎么走词条1 词条2 词条3 词条4 … … 词典自跳转语言模型的中任意单个词一些同义词构成的词组集合。例如：想，要，要求一些专名集合。例如人名，地名等一些助词。例如：吧，呢，吗等个性化的专名和称谓 Grammer：打电话给【人名】发短息给【人名】说【短信内容】从【地名】到【地名】怎么走我想订【时间】的去【地名】的机票发短信给【妈妈】说我去贵阳开会了未来：统计语言模型之后最大墒语言模型 RNN 短语模型 - 层次短语模型词典定义词类定义

混合高斯模型和ＤＮＮ模型图二：深度神经网络。。。更多隐层图一：混合高斯模型

ＤＮＮ模型在百度的应用百度在2012年9月份上线了语音搜索引擎的DNN模型, 2012年10月份和2012年12月份分别上线了百度的语音输入法和语音助手的DNN模型。平均相对误识别率相对于百度最好的GMM系统而言降低20%以上

语音识别中的DNN成功的启示 DNN成功的原因 DNN成功的启示深度建模：深度多层的网络结构特征融合：融合当前帧的更多的左右context信息稀疏化的权重分布：神经元的局部记忆激活海量数据训练 GPU训练 DNN成功的启示要采用能够使用更多特征的分类器要选择能够配合大数据使用的分类器要采用能够随着数据量增加就轻松的scale up的分类器要选择能够分布式并行化训练的分类器要选择能够用算法简化结构的模型，分类器要能够压缩在线计算量不片面追求优化算法的最优，更重视大数据的使用

Down-pure SGD (on-line method) 异步SGD训练和LBFGS Down-pure SGD (on-line method) LBFGS Bache mode Robust to computer failure Possible sub-set model parameter sharing Introduce more stochasticity Asynchronous model update Much less bandwidth requirement Bache mode learning

基于二阶统计信息的DNN训练 Deep learning: 一个拥有千万个未知参数的数学优化问题。 Hassian-Free Deep Learning: (1) 神经网络的输出损失函数（交互墒，最小二乘，softmax) 是凸函数 (2) 采用高斯牛顿法近似整个神经网络的损失函数 (3) 由于G是正定的，因此构建下面的二阶辅助目标函数 (4) 共轭梯度法优化二阶辅助目标函数 (5) 核心Trick1: Gd 核心Trick2: Mini-bache 高斯牛顿估计核心Trick3: Back-tracing 高斯牛顿法的二阶矩阵G 如何调节？

序列化的区分度DNN学习交互墒准则 2. 关键帧抽样和引入序列信息的序列区分度 VTB结果 Lattice结果

分布式多GPU并行DNN训练系统 = 数据分布式存储，模型集中存储每个计算节点是都采用单机四核的异步SGD算法。。。树状和环装连接同时支持的网络结构 PC Server GPU = 计算平台 (Deep Brain) 数据分布式存储，模型集中存储每个计算节点是都采用单机四核的异步SGD算法跨机多GPU并行DNN训练问题的主要难度： - 基于mini-bache的SGD算法本质上是个串行算法跨机器异步SGD的机器间通讯时间远大于训练时间提出一种分布式跨机多GPU并行训练新算法：结合平均SGD和异步SGD。成功解决上述问题。算法效果：训练速度可以加速10倍以上，识别率较单机训练低于0.5点以内

人才招聘 - 相信技术的力量 1. 招聘对语音识别技术、语音合成技术、音乐处理相关技术自然语言处理技术，和机器学习技术有热情的年轻人。人才招聘 - 相信技术的力量 1. 招聘对语音识别技术、语音合成技术、音乐处理相关技术自然语言处理技术，和机器学习技术有热情的年轻人。 2. 较好的算法或者产品研发经验，优秀的代码能力 3. jialei@baidu.com

结束… 谢谢大家