Presentation is loading. Please wait.

Presentation is loading. Please wait.

基于自然语言理解的智能搜索引擎 在移动互联网络上的应用

Similar presentations


Presentation on theme: "基于自然语言理解的智能搜索引擎 在移动互联网络上的应用"— Presentation transcript:

1 基于自然语言理解的智能搜索引擎 在移动互联网络上的应用
清华大学移动互联专家论坛 基于自然语言理解的智能搜索引擎 在移动互联网络上的应用 郑 方 智能技术与系统国家重点实验室 清华大学语音技术中心 & Weniwen Technologies Limited 2001年6月12日

2 网为什么而存在? 网为信息交流存在! 信息中心及网络 互联网 电话网络 无线 互联网 互联网 无线 互联网 互联网 电话网络 无线 互联网

3 传统网→移动无线网 键盘: 从大到小(手机、电话) 从小到无(掌上电脑) 输入成为大问题

4 移动信息存取面临的挑战 易用性方面 存取速度方面 移动性方面 用移动设备上的小键盘输入 菜单步骤 汉字输入方法 键入速度 电话的免提输入
随处可存取 设备间的互用性

5 传统搜索引擎的特点 互联网上的信息搜索一般都是基于关键词的。缺点: 声讯台上的信息查询一般都是基于菜单选择的。缺点:
拼出来的关键词:查“索引”,得到“搜索引擎” 拆出来的关键词:查“互联网络”,得到“互联”和“网络” 结果成千上万,真正需要的内容很少 不能理解语义:查“电脑”,但若只有“计算机” 则得不到所要的结果 声讯台上的信息查询一般都是基于菜单选择的。缺点: 不直接,需要多级菜单选择 用户总是被动的 需要有语义理解的智能搜索

6 最自然的方式是--人类的语言 让计算机理解人类的语言
最自然的方式是--人类的语言 让计算机理解人类的语言

7 首先需要得到文本信息

8 在此基础上:“对话理解是关键” 输入解决方案套餐 有大键盘可用时:可用任何输入法输入句子,包括整句拼音输入法、语音识别输入法
仅有数字键盘时:可用整句数字输入法、语音输入法 当无键盘使用时:可用自然语音输入法 在此基础上:“对话理解是关键”

9 面临的一些关键技术问题需要解决(1) 口语:与书面语和朗读语音有很大不同 省略:计算机系的学生住在哪? <…> 电子系呢?
省略:计算机系的学生住在哪? <…> 电子系呢? 更正:我想买张星期三 哦 星期四 的机票 重复:请问明天 哦 明天天气如何;请问明天 哦 星期三天气如何 强调:请帮我查一下有关电脑,就是计算机,方面的专业网站 倒序:从北京到上海多长时间得飞 无序:我想买张票,从上海,周三,去深圳,要国航的,往返的 噪音:来自环境 含混不清语音:尤其在快速说话时 无意义语音:口头语,以及啊、嗯等 迟疑:说话人正在寻找合适的词语表达意思 吃音及音变:口语最常见现象 韵律:不同的韵律有可能导致完全不同的含义

10 面临的一些关键技术问题需要解决(2) 汉语:与西方语言不同 口语对话系统应运而生:其目的是通过人机交互对话来完成信息查询等任务
不能完全套用西方语言的语言理解方法 汉语重表意,而不注意语法是否严格 如:月黑杀人夜、风高放火天 语法分析不够,还需要语义分析 口语对话系统应运而生:其目的是通过人机交互对话来完成信息查询等任务

11 口语对话系统的基本框架 数据库 应用程序 语音识别 语义分析 对话管理 对话生成 语音合成 用户 从词网格分析语义 解决口语语言现象
转换为内部表示 结合模板和NLG技术 能处理“无结果” 上下文相关理解 话题转换,用户焦点 记忆与遗忘 混合主导 音字/词网格 解决口语语音问题 解决噪音、口音问题 高自然度 有一定的韵律 用户

12 对话管理 语义分析 对话生成 语音识别 语音合成 用户

13 我们的解决方案 自动语音识别 自然语言理解 “单源/多设备”体系结构

14 满足应用的需要 小键盘上的上下文预测“快速输入” 汉语“音-字”转换,只需输入拼音甚至数字即得汉字,不用选 易用性方面 存取速度方面
“一步” 问答格式,直接用自然语言 电话“语音识别” 移动性方面 “缩减”语音询问所需“菜单步骤”,无需菜单选择 准备一次 / 随处存取 “单源 / 多设备”存取

15 Voice Browser or Natural Language Query Answering 模块
“单源/多设备”体系结构 文本 Voice Browser or Natural Language Query Answering 模块 拼音 输入法 Web网关 文本 数字 输入法 知识库 WAP/iMode 网关 声音 口语 对话 电话接口

16 CST演示系统 整句数字输入法 整句拼音输入法 语音命令控制 关键词检出器 汉语语音听写机 航班订票系统 校园导游系统 发音水平评价
声纹识别系统 互联网上的查询 基于WAP的查询 基于PDA的查询 基于电话的查询

17 and Weniwen Technologies Limited
谢 谢 ! 郑 方 智能技术与系统国家重点实验室 清华大学语音技术中心 and Weniwen Technologies Limited 2001年6月12日

18 演示-整句数字输入法

19 演示-整句拼音输入法

20 演示-语音命令控制

21 演示-关键词检出器

22 演示-汉语语音听写机

23 演示-航班订票系统

24 演示-校园导游系统

25 演示-发音水平评价

26 演示-声纹识别系统

27 演示-互联网上的查询

28 演示-基于WAP的查询

29 演示-基于PDA的查询

30 演示-基于电话的查询


Download ppt "基于自然语言理解的智能搜索引擎 在移动互联网络上的应用"

Similar presentations


Ads by Google