基于自然语言理解的智能搜索引擎 在移动互联网络上的应用

Slides:



Advertisements
Similar presentations
簡訊於教務系統上的應用 簡報者 : 陳瑞發 林偉川 教務處 & 資訊工程系 淡江大學. 緣 由 通訊科技技術的發展為 21 世紀中重要的領域之一 無線通訊網路的研究與應用是未來發展的方向 校園的固接式網路有良好的基礎建設 校園網路上的應用與開發不斷的進行中, 如網路 線上選課, 辦公室自動化 結合現有已完成的資源,
Advertisements

数据结构的引入. 通讯录管理 社团机构管理 校园导航管理 通讯录管理 社团机构管理 校园导航管理.
一、老师申请题目,以下指导老 师操作。 1. 登录教务系统 web 端. 2. 点击 “ 毕业设计 ” 工具栏下拉菜单中的 “ 论文 _ 教师申请题目 ”
GOOWI 万物“无”连 --低功耗蓝牙在IoT中的应用    魏心伟 高为通信技术有限公司.
夯实基层 创新进取 大力践行医药卫生体制改革 丽水市卫生局 黄 刚
數位教學設計師人才培育計畫 國立台灣師範大學主辦 二○○五年六月八日 談中國文學多媒體教學及網站建構方法
山东英才学院 SHANDONG YINGCAI UNIVERSITY
随身携带的图书馆 ——移动图书馆服务介绍 主讲人:陈洋阳.
第三节 灰树花栽培技术 主讲 段鸿斌.
开展优质护理服务 落实重患护理 沈阳市第四人民医院 姚军.
智慧校园的利用.
热点五 加强未成年人思想道德建设 关心下一代人健康茁壮成长.
地税政策发布 顺德地税局纳税服务局 2012年1月20日.
第八章 网络课程的设计与开发.
第七章 现代教育技术的应用 第一节 现代教育技术与生物学教育 第二节 计算机及其相关技术在生物学 第三节 互联网在生物学教学中的应用
实用操作系统概念 张惠娟 副教授 1.
综合布线技术与实践教程 第九章:综合布线系统工程网络分析 课程网站:
C++中的声音处理 在传统Turbo C环境中,如果想用C语言控制电脑发声,可以用Sound函数。在VC6.6环境中如果想控制电脑发声则采用Beep函数。原型为: Beep(频率,持续时间) , 单位毫秒 暂停程序执行使用Sleep函数 Sleep(持续时间), 单位毫秒 引用这两个函数时,必须包含头文件
计算机基础知识 丁家营镇九年制学校 徐中先.
DM81X 视频采集处理 ——MCFW框架介绍 广州创龙电子科技有限公司
嵌入式系统课程简介 宋健建 南京大学软件学院 2004/02/10.
鄉村尋根-農具篇.
面向对象建模技术 软件工程系 林 琳.
Chinese Virtual Observatory
R in Enterprise Environment 企业环境中的R
从现在做起 彻底改变你自己 Sanjay Mirchandani EMC公司高级副总裁、首席信息官.
存储系统.
大学计算机基础 典型案例之一 构建FPT服务器.
三星C3528 培训资料.
SQL Injection.
乐驾-车载无线终端-CARRO 产品类型:车载无线路由器 建议零售价格:¥599 江苏鸿信
第五讲 四则运算计算器(一) 精品教程《C#程序设计与应用(第2版)清华大学出版社 谭恒松 主编
公安部科技局/北京市公安局《声纹鉴定与自动识别技术应用研讨会》 2002年9月16日 声纹自动识别技术的 关键与核心算法 鄭 方
数据挖掘工具性能比较.
Multi-Function PowerPiont Template
搜 刘智 iLife信息素养协会 索.
WSDM见闻 程龚.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
混合绘制 2019/4/5 Visual Analytics Group | CAD&CG国家重点实验室.
SOA – Experiment 2: Query Classification Web Service
编程作业3:网页正文抽取 (10分).
黄 勇 广州大学计算机教育软件研究所 互联网上的数学公式处理 黄 勇 广州大学计算机教育软件研究所
准备考试 一组(20人)考生拍照结束后,工作人员会发给考生朗读篇目和说话题目的抽签条(抽签条上不允许写上任何字词);考生准备时间为10-15分钟;准备结束,进入测试室正式测试.
姓名 遥感科学国家重点实验室 中国科学院遥感与数字地球研究所﹒北京师范大学 地址:北京市朝阳区大屯路甲20号北 北京9718信箱
EBNF与操作语义 请用扩展的 BNF 描述 javascript语言里语句的结构;并用操作语义的方法描述对应的语义规则
计算机及办公软件应用 ©2013 苏州工业园区职业技术学院
下一代网络营销探讨 —网络营销移动化问题思考
中文题名 介绍/亮点 研究方法 结果/讨论 结论 作者1 1*,作者2 1,2,作者3 2
朱晓兰 博士 深圳市华琛科技有限公司 VoiceXML给我们生活带来的影响 朱晓兰 博士 深圳市华琛科技有限公司
SAGE-移动终端授权 ----校外访问SAGE资源 北京办公室 1.
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
201x 公司LOGO LOGO XX公司年终总结 201x/10/18 201x
中国风背景论文答辩模板 某大学某某信息学院 答辩学生:代用名 指导老师:代用名 答辩时间:201X年1月30日
JSP实用教程 清华大学出版社 第2章 JSP运行环境和开发环境 教学目标 教学重点 教学过程 2019年5月7日.
双语例句搜索 句库+巨酷 Web: Beijing 2008.
LOGIX500软件入门 西安华光信息技术有限公司 2008年7月11日.
魏新宇 MATLAB/Simulink 与控制系统仿真 魏新宇
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
“修身成材” 班级干部培训班 黑龙江大学党委学工部.
深 圳 职 业 技 术 学 院 SHENZHEN POLYTECHNIC
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
Continuous Authentication for Voice Assistants
欧式复古花纹模板 ST模板 年4月14日.
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
学习数据结构的意义 (C语言版) 《数据结构》在线开放课程 主讲人:李刚
入侵检测技术 大连理工大学软件学院 毕玲.
网页版报名流程 Step 4 点击“详情”查阅具体岗位信息,输入身份数据及申请序列码进行最终报名
2019/9/19 互联网产业、立法与网规 张钦坤 腾讯法务部.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

基于自然语言理解的智能搜索引擎 在移动互联网络上的应用 清华大学移动互联专家论坛 基于自然语言理解的智能搜索引擎 在移动互联网络上的应用 郑 方 智能技术与系统国家重点实验室 清华大学语音技术中心 & Weniwen Technologies Limited 2001年6月12日 fzheng@sp.cs.tsinghua.edu.cn http://sp.cs.tsinghua.edu.cn/~fzheng/

网为什么而存在? 网为信息交流存在! 信息中心及网络 互联网 电话网络 无线 互联网 互联网 无线 互联网 互联网 电话网络 无线 互联网

传统网→移动无线网 键盘: 从大到小(手机、电话) 从小到无(掌上电脑) 输入成为大问题

移动信息存取面临的挑战 易用性方面 存取速度方面 移动性方面 用移动设备上的小键盘输入 菜单步骤 汉字输入方法 键入速度 电话的免提输入 随处可存取 设备间的互用性

传统搜索引擎的特点 互联网上的信息搜索一般都是基于关键词的。缺点: 声讯台上的信息查询一般都是基于菜单选择的。缺点: 拼出来的关键词:查“索引”,得到“搜索引擎” 拆出来的关键词:查“互联网络”,得到“互联”和“网络” 结果成千上万,真正需要的内容很少 不能理解语义:查“电脑”,但若只有“计算机” 则得不到所要的结果 声讯台上的信息查询一般都是基于菜单选择的。缺点: 不直接,需要多级菜单选择 用户总是被动的 需要有语义理解的智能搜索

最自然的方式是--人类的语言 让计算机理解人类的语言 最自然的方式是--人类的语言 让计算机理解人类的语言

首先需要得到文本信息

在此基础上:“对话理解是关键” 输入解决方案套餐 有大键盘可用时:可用任何输入法输入句子,包括整句拼音输入法、语音识别输入法 仅有数字键盘时:可用整句数字输入法、语音输入法 当无键盘使用时:可用自然语音输入法 在此基础上:“对话理解是关键”

面临的一些关键技术问题需要解决(1) 口语:与书面语和朗读语音有很大不同 省略:计算机系的学生住在哪? <…> 电子系呢? 省略:计算机系的学生住在哪? <…> 电子系呢? 更正:我想买张星期三 哦 星期四 的机票 重复:请问明天 哦 明天天气如何;请问明天 哦 星期三天气如何 强调:请帮我查一下有关电脑,就是计算机,方面的专业网站 倒序:从北京到上海多长时间得飞 无序:我想买张票,从上海,周三,去深圳,要国航的,往返的 噪音:来自环境 含混不清语音:尤其在快速说话时 无意义语音:口头语,以及啊、嗯等 迟疑:说话人正在寻找合适的词语表达意思 吃音及音变:口语最常见现象 韵律:不同的韵律有可能导致完全不同的含义

面临的一些关键技术问题需要解决(2) 汉语:与西方语言不同 口语对话系统应运而生:其目的是通过人机交互对话来完成信息查询等任务 不能完全套用西方语言的语言理解方法 汉语重表意,而不注意语法是否严格 如:月黑杀人夜、风高放火天 语法分析不够,还需要语义分析 口语对话系统应运而生:其目的是通过人机交互对话来完成信息查询等任务

口语对话系统的基本框架 数据库 应用程序 语音识别 语义分析 对话管理 对话生成 语音合成 用户 从词网格分析语义 解决口语语言现象 转换为内部表示 结合模板和NLG技术 能处理“无结果” 上下文相关理解 话题转换,用户焦点 记忆与遗忘 混合主导 音字/词网格 解决口语语音问题 解决噪音、口音问题 高自然度 有一定的韵律 用户

对话管理 语义分析 对话生成 语音识别 语音合成 用户

我们的解决方案 自动语音识别 自然语言理解 “单源/多设备”体系结构

满足应用的需要 小键盘上的上下文预测“快速输入” 汉语“音-字”转换,只需输入拼音甚至数字即得汉字,不用选 易用性方面 存取速度方面 “一步” 问答格式,直接用自然语言 电话“语音识别” 移动性方面 “缩减”语音询问所需“菜单步骤”,无需菜单选择 准备一次 / 随处存取 “单源 / 多设备”存取

Voice Browser or Natural Language Query Answering 模块 “单源/多设备”体系结构 文本 Voice Browser or Natural Language Query Answering 模块 拼音 输入法 Web网关 文本 数字 输入法 知识库 WAP/iMode 网关 声音 口语 对话 电话接口

CST演示系统 整句数字输入法 整句拼音输入法 语音命令控制 关键词检出器 汉语语音听写机 航班订票系统 校园导游系统 发音水平评价 声纹识别系统 互联网上的查询 基于WAP的查询 基于PDA的查询 基于电话的查询

and Weniwen Technologies Limited 谢 谢 ! 郑 方 智能技术与系统国家重点实验室 清华大学语音技术中心 and Weniwen Technologies Limited 2001年6月12日 fzheng@sp.cs.tsinghua.edu.cn http://sp.cs.tsinghua.edu.cn/~fzheng/

演示-整句数字输入法

演示-整句拼音输入法

演示-语音命令控制

演示-关键词检出器

演示-汉语语音听写机

演示-航班订票系统

演示-校园导游系统

演示-发音水平评价

演示-声纹识别系统

演示-互联网上的查询

演示-基于WAP的查询

演示-基于PDA的查询

演示-基于电话的查询