Download presentation
Presentation is loading. Please wait.
1
Ekho TTS 简介 (文本转语音引擎) 主讲:黄冠能
动画 (基本) 注意:此视频模板针对 Microsoft PowerPoint 2010 进行了优化。 在 PowerPoint 2007 中,视频元素将会播放,但与视频栏重叠的任何内容都将在幻灯片放映模式下被视频覆盖。 在 PowerPoint 2003 中,视频将不会播放,但视频的标牌框架将保持不变,就像静态图像一样。 视频: 在每次切换幻灯片后自动播放。 时长 15 秒。 无缝地无限循环播放。 若要添加幻灯片或更改版式: 若要添加新的幻灯片,请在“开始”选项卡上的“幻灯片”组中,单击“新建幻灯片”下方的箭头,在“动画背景主题”下方单击,然后选择所需版式。 若要更改现有幻灯片的版式,请在“开始”选项卡的“幻灯片”组中,单击“版式”,然后选择所需版式。 其他动画元素: 您插入的任何动画元素都将从切换幻灯片并且背景视频开始播放后开始。 hgneng at yahoo.com.cn
2
自我介绍 eGuideDog项目简介 Ekho的发展历史 Ekho的技术简介 如何向Ekho添加新的声音 如何向Ekho添加新的方言
主要内容 自我介绍 eGuideDog项目简介 Ekho的发展历史 Ekho的技术简介 如何向Ekho添加新的声音 如何向Ekho添加新的方言 WebSpeech
3
自我介绍 1982年,广州出生 1992年,在中华学习机上使用LOGO语言写下 第一句代码:FD 50 广雅中学 华中科技大学 中山大学
广东北电 UC Work at home with Drupal
4
eGuideDog项目简介
5
eGuideDog的使命 创立于2006年 使命: 编写给盲人用的自由软件 促进汉语方言的保育 让世界开源软件舞台上多一个中国人的名字
6
Project of the Month, February 2011
7
eGuideDog的组成 Ekho TTS eGuideDog NVDA Browser Windchime Web Anywhere
WebSpeech eGuideDog Browser is a text browser written in Perl. Windchime a tool for reading CAPTCHA. Both are deprecated. 加动画,把每个圈放大。 Cantonese Dictionary eSpeak Chinese Vinux
8
WebAnywhere Demo
9
自我介绍 eGuideDog项目简介 Ekho的发展历史 Ekho的技术简介 如何向Ekho添加新的声音 如何向Ekho添加新的方言
主要内容 自我介绍 eGuideDog项目简介 Ekho的发展历史 Ekho的技术简介 如何向Ekho添加新的声音 如何向Ekho添加新的方言 WebSpeech
10
Ekho的发展历史(一) 2007.9:粤语词典初步编写完成,eSpeak开始支持粤 语。
:在王相成和Silas S. Brown的帮助下eSpeak开 始支持普通话。该声音曾被Google Translate使用过。 2008.3:由于eSpeak的声音质量难以改善,开始研发 Ekho TTS,第一版本仅支持粤语。 2008.7:在Silas S. Brown和Yali Cheng的帮助下,Ekho 支持普通话。同时,Ekho通过调用Festival支持英 语。 :在Silas S. Brown和Hae-Sung Jeon的帮助 下,Ekho支持简单的韩国语。
11
Ekho的发展历史(二) 2009.11:Ekho 2.0发布,支持Windows SAPI5。
:WebAnywhere中国站 导航服务,背后使用Ekho作为语音引擎。 :Ekho 4.0发布,开始支持Android。 :在寥伟成先生的帮助下,Ekho从4.8版本开 始支持诏安客家话。 2012.3:Ekho TTS在Google Play上发布,支持2.x版 本。 2012.3:Ekho 汉语-西班牙语 特别版发布。 2012.5:Ekho 4.12发布,开始支持speech-dispatcher API,实现Linux语音引擎的标准接口。
12
Ekho Demo
13
自我介绍 eGuideDog项目简介 Ekho的发展历史 Ekho的技术简介 如何向Ekho添加新的声音 如何向Ekho添加新的方言
主要内容 自我介绍 eGuideDog项目简介 Ekho的发展历史 Ekho的技术简介 如何向Ekho添加新的声音 如何向Ekho添加新的方言 WebSpeech
14
Linux下安装Ekho $ tar xjvf ekho-xxx.tar.bz2 $ cd ekho-xxx $ ./configure $ make && $ sudo make install $ ekho "hello 123“ 软件依赖:libsndfile1-dev,libpulse-dev,libncurses5- dev,libgtk2.0-dev,libvorbis-dev,liblame-dev 如果需要朗读英语,需要打开Festival支持: $ ./configure --enable-festival 必要时替换静态库:lib/*.a 查看更多功能开关:$ ./configure -h 参考:
15
Linux C++中调用Ekho #include "ekho.h" using namespace ekho;
int main(int argc, char **argv) { Ekho wong("Cantonese"); wong.blockSpeak("123"); return 0; } 参考:
16
Ekho的架构 参考:
17
Ekho的原理 汉字 普通话约2000个拼音,粤语约5000个 拼音 一个拼音对应一个音频文件,简单拼接输出 音频文件
18
自我介绍 eGuideDog项目简介 Ekho的发展历史 Ekho的技术简介 如何向Ekho添加新的声音 如何向Ekho添加新的方言
主要内容 自我介绍 eGuideDog项目简介 Ekho的发展历史 Ekho的技术简介 如何向Ekho添加新的声音 如何向Ekho添加新的方言 WebSpeech
19
如何向Ekho添加新的声音 找一个质量过得去的麦克风,一个安静的房间
获取拼音列表:a1, a2, a3, a4, a5, ai1, ai2, ai3, ai4, ai5 … 使用Audacity软件录制,按正常语速读每一个音,中 间可插入一些额外的字(如“的”)以增强连贯性。 使用Audacity剪切提取每一个拼音的音频,文件名依 次为:a1.wav, a2.wav … (善用Audacity的快捷键,可 编写脚本帮助修改文件名) 把音频文件替换Ekho软件中的相应文件 参考:
20
如何向Ekho添加新的方言
21
如何向Ekho添加新的方言 查找方言使用的音标系统(从Wikipedia开始) 查找是否存在相应词典,如果没有则需要自己编写。格式如 下:
谨 gan2 谩 maan4 (谩 骂) maan6|maa6 为所有音录制音频文件 把词典和声音发给我,告诉我新增方言的一些特殊变音规 则,并同意以GPL v2+许可发布。
22
自我介绍 eGuideDog项目简介 Ekho的发展历史 Ekho的技术简介 如何向Ekho添加新的声音 如何向Ekho添加新的方言
主要内容 自我介绍 eGuideDog项目简介 Ekho的发展历史 Ekho的技术简介 如何向Ekho添加新的声音 如何向Ekho添加新的方言 WebSpeech
23
WebSpeech是什么? WebSpeech是一个Javascript库,可让网页发声,支持 Android。
WebSpeech可编写一些基于Web的语音小游戏(如 eGuideDog网站中的华容道和记忆翻牌游戏),编写 在线发声词典,为网页添加语音导读功能。 参考:
24
发声词典 在线发声粤语词典(支持Android):
25
语音导读功能
26
一个WebSpeech的使用例子 <html> <head> <script type='text/javascript' src='/WebSpeech/WebSpeech.js'></script> </head> <body> Have you heard the voice? <script type='text/javascript'> WebSpeech.speak('hello world'); </script> </body> </html> 参考:
27
TODO Ekho实现Android 4.x TTS引擎标准接口。
为Windows版Ekho实现非SAPI接口,以供移动版的 NVDA使用。 支持藏语(一个同时支持藏语、汉语、英语的 TTS)。
28
eGuideDog相关资源 网址:http://www.eguidedog.net
声网宝(WebAnywhere)网址: SVN(需预留超过2G的硬盘空间):svn co guidedog.svn.sourceforge.net/svnroot/e-guidedog e- guidedog 在线浏览代码: guidedog.svn.sourceforge.net/viewvc/e-guidedog/ 论坛: guidedog/forums/forum/643787
29
问答环节 谢谢!
Similar presentations