日本中国语学会关东支部扩大会议・中央大学

Slides:



Advertisements
Similar presentations
《礼记 · 学记》学习心得报告 教育的本质与运用 主讲人:徐浩明. 一、认识什么是教育 二、明白教育的本质 三、如何落实德行教育.
Advertisements

精彩人生.
19. 谈礼貌.
社 戏 短篇小说 鲁迅.
智慧城.
《史记·魏公子列传》.
窦娥冤 关汉卿 感天动地 元·关汉卿.
第五章 话语的语用意义(上) 主讲人:周明强.
兵 车 行 杜甫.
人教版语文 三年级下册 语文园地四 作者:佚名 来源:网络.
决战中考 ——2014年中考语文要点复习汇总.
第2课 大一统与秦朝中央集权制度的确立 课标要求: 知道“始皇帝”的来历和郡县制建立的史实,了解中国古代中央集权制度的形成及其影响。
品读论语之四---- 巧言令色非君子.
知其不可而为之.
第十四篇 答李翊書 韓 愈.
先秦诸子散文.
珠海市夏湾中学 曾雪静 引言: 清朝是中国最后一个封建王朝,共有12位皇帝。他们各有个的故事,有的开创了“盛世”有的则把清朝推向灭亡。下面,请看清朝列位皇帝简介 清朝皇帝史.
苏教版语文九上第二单元的诵读欣赏: 《诗经》二首 执教者:唐晨曦.
短歌行.
史記 貨 殖 列 傳                                                            商业篇.
陈情表 李密 龙江一中高二语文备课组.
16.桥 南边小学 韩巧仪 写法 洪水 形象 语言1 语言2 语言3 语言4 想象说话 图片.
第一单元  秋天的故事.
第16课时: 桥.
主办:泰兴市质量强市领导小组办公室 承办:泰 兴 市 市 场 监 督 管 理 局.
先秦散文专题 郑国岱.
人教新课标版(2013修订)初中七上 《寓言四则》.
高考复习专题 文言文翻译
声调.
我的识字方法 吴佳昊 试验小学 一 (1)班.
2.立身处世.
第九章 心理语言学 一、语言获得 二、字词识别中的词频效应 三、句子理解时间的测量.
请您欣赏.
在生活中,我们看见姓李的老师称李老师,看见姓李的会计称李会计,看见姓李的厂长称李厂长,那看见姓李的粉刷师傅,我们称他什么呢?为什么称河北大街一家营造厂的师傅为“刷子李”呢? “刷子李” 的技艺到底有多高?今天这节课我们来看看作者是怎样描写的。
苏教版小学语文第七册 5.我给江主席献花 第一课时 侯小群.
第十九课 南吕•一枝花 不 伏 老 关汉卿.
他是一位叱咤风云的人物,一位毁誉参半的领袖。
食物在口腔里的变化.
酒 中国是一个 文化历史悠久的国家.
理解常见文言实词在文中的含义.
项目: 林教头风雪山神庙 施耐庵 制作人:语文组教师詹永碧.
鲁智深倒拔垂杨柳 施耐庵 罗贯中.
杨玉环(公元719-756年) 杨玉环,名玉环,字太真,唐玄宗李隆基的宠妃,原名杨芙蓉(故有芙蓉出水),出生地为四川成都,祖籍山西永济。杨贵妃自小习音律,善歌舞,姿色超群。曾祖父杨汪是隋朝的上柱国、吏部尚书,唐初被李世民所杀,父杨玄琰(yǎn),是蜀州(四川崇州)司户,其叔父杨玄璬(jiǎo)曾任河南府士曹,杨玉环的童年是在四川度过的,10岁左右,父亲去世,她寄养在洛阳的三叔杨玄璬家。后来又迁往山西永乐(山西永济)。 
左迁至蓝关示侄孙湘 韩愈.
《生活与哲学》第一轮复习 第七课唯物辩证法的联系观.
科普说明文 生物入侵者 高天群.
文化底蕴与作文 第一节:底蕴成句 【温馨点拨】:底蕴成句是把含有文化底蕴的内容表达成句。底蕴成句有三种情况:
당신을 향한 노래.
爱的真谛 其它敬拜赞美诗歌23首.
D t n l 2017语文一年级上册新教材.
语音练习(二) 制作:王树海.
海燕 郑振铎.
小 学 语 文 二 年 级 下 册 第 一单 元.
6一株紫丁香. 6一株紫丁香 任务一: 初读课文,学会生字新词。 策略一:自由朗读课文,边读边勾画生字新词,同桌之间把这些生字新词多读几遍。
宝剑锋从磨砺出, 梅花香自苦寒来.
家.
苏教版语文一年级上册.
Dì bā kè Rèn shì yán sè 第八課 認識顏色.
(起点) (终点) 起跳点 落脚点 距离 qĭ luò qĭ zhōng tiào jiăo diăn diăn diăn diăn
语文百花园八.
猜谜语 像 云 不 是 云, 像 烟 不 是 烟, 风 吹 轻 轻 飘, 日 出 慢 慢 散。 (打一自然现象)
语文S版 一年级 语文 上册.
长 城.
小学数学第一册 10的认识 锦山小学 高婧媛.
20 谈礼貌 合肥市螺岗小学 赵勋.
家.
11 北风和小鱼.
多姿多彩的世界.
台灣房價指數 台灣房屋 中央大學 2011年7月29日.
Presentation transcript:

日本中国语学会关东支部扩大会议・中央大学 XIMERA中的汉语语音合成技术 倪 晋富 坂井 信辅 中村 哲 (NICT/ATR-SLC) (2008/03/22) 日本中国语学会关东支部扩大会议・中央大学

发表概要 语音合成系统概述 文本规范化 词典构成 语言模型 分词及词性标记评价 拼音转换评价 韵律参数预测 演示 语音数据库 相关工作 语调转换 韵律再合成 强化虚词处理

语音合成系统略图 文本处理 语音合成器 韵律控制 说什么 怎么说 发音 波形拼接型合成器 源滤波器型合成器 输入文本 合成语音 注:语音合成系统合成语音,但现在的合成系统并不具有文本理解能力。

XIMERA汉语语音合成概述 文本规范化 说什么 分词、词性标记及发音生成 韵律词及短语预测 怎么说 单元选择及波形拼接 语音参数预测 输入文本 房价是$150。 文本规范化 口语规则 房价是一百五十美元。 说什么 分词、词性标记及发音生成 词典 房价 是 一百五十 美元 。 名词 动词 数词 名词 符号 fang2jia4 shi4 yi1bai2wu3shi2mei3yuan2 语言模型 韵律词 韵律词及短语预测 口语规则 韵律短语 怎么说 1 句子基频曲线 2 音素时长参数 3 能量参数 4 谱参数 声学模型 语音参数预测 语音 数据库 单元选择及波形拼接 输出合成语音

文本规范化 数词 符号 … 3% 3‰ №3 §3 3° 3℃ 2:5 US$3 £3 ∵ ∴ ∽ ∞ ≡ = ≈ ≠ ≥ ≤ 百分之三 3%  3‰ №3 §3 3° 3℃ 2:5 US$3 £3 ∵ ∴ ∽ ∞ ≡ = ≈ ≠ ≥ ≤  百分之三  千分之三  三号  第三  三度  三摄氏度  二比五  三美元  三英镑  因为  所以  相似于  无穷大  恒等于  等于  约等于  不等于  大于  小于 数词 符号 1,234   90年代 住303 拨220  代码:727 3·15 “3·15”  一千二百三十四  九十年代  住三零三  拨二二零  代码:七二七  三点一五  “三·一五” ①  ⑴  Ⅻ 2dB 2Hz 2Gm 2Mm …   一、  十二  二分贝  二赫兹  二京米  二兆米 ‘98  2‘54“  2:12:01PM 上午9:01 下午2:20-3 2003/03/3 1/3 绩是33-03 分是33-03 以33-03 3-5%  九八  二分五十四秒  午后二点十二分一秒  上午九点一分  下午二点二十分至三点  二零零三年三月三日  三分之一  绩是三十三比三  分是三十三比三  以三十三比三  百分之三至百分之五 4×4 200米*3  ×经理 … 四乘四 二百米乘三 某经理

词典构成 拼写 频度 词性 拼音 东京都,3000,地名,dong1 jing1 du1 一般名词 专有名词 地名 时间词 代词 动词(17类) 形容词 副词(5类) 量词 介词 定词(5类) 连词(4类) 助词(2类) 时态标记 叹词 后置词 位置词 外国语 62,562 138,856 25,592 2,443 404 52,114 2,790 2,958 492 248 1,192 262 98 22 71 69 370 东京都,3000,地名,dong1 jing1 du1 毛泽东,1500,专有名词,mao2 ze2 dong1 … 拼写 频度 词性 拼音 (290,624条汉语词及符号)

语言模型 HMM (hidden Markov model:马尔可夫模型) 房价/名词 是/ 动词 一百五十/数词 美元/名词 。/符号 房价/名词 是/ 动词 一百五十/数词 美元/名词 。/符号 词性拼写unigram: 房价/名词, 是/动词 , … 词性bigram: 名词-动词, 动词-数词, 数词-名词, 名词-符号 房价/名词 是/ 动词 一百五十/数词 美元/名词 。/符号 词性unigram: 名词, 动词, 数词 拼写unigram: 房价, 是, 一百五十, 美元, 。 词性拼写unigram: 房价/名词, 是/动词 , … 词性bigram: 名词-动词, 动词-数词, 数词-名词, 名词-符号 词性拼写bigram1: 房价/名词- 动词, 是/ 动词-数词, … 词性拼写bigram2: 名词-是/动词, 动词-一百五十/数词, … 拼写bigram: 房价-是, 是-一百五十, 一百五十-美元, 美元-。 CRF(conditional random field: 条件随机场)

Mecab (http://mecab.sourceforge.net) 分词及词性标记评价 分析软件:和布蕪 训练语料库:人工检查过词边界及词性标记 训练集大小:含有2,406,780词的句子 测试集(训练集外)大小:含有2,396,950词的句子 Mecab (http://mecab.sourceforge.net) 单词 96.7% 98.5% 单词和词性 92.3% 94.5% 词典大小:136,787 (来自训练用语料库) 单词 n/a 97.0% 单词和词性 93.7% 词典大小: 290,624 (来自各种语料库) 单词 n/a 96.5% 单词和词性 91.0% 词典大小: 560,168 (以上汉语词库+日语词) HMM CRF

拼音转换评价 典型错误分析: 测试集:约15000句(229,332音节),人工检查过拼音 有调音节正确率:97.0% 无调音节正确率:99.2% 典型错误分析: 词性错误 模糊性 长 【名词】 chang2 长 1米 长 【动词】 zhang3 长 1米 藏 【名词】 zang4 藏 族 藏 【动词】 cang2 藏 东西 地 【名词】 di4 种 地 地 【助词】 de0 慢慢 地 好 【形容词】 hao3 好 吃 好 【副词】 hao4 好 吃 圈 【名词】 juan4 羊 圈 圈 【动词】 quan1 圈 东西 … 调 【动词】 tiao3 调 音量 调 【动词】 diao4 调 文件 系 【动词】 ji4 系 鞋带 系 【动词】 xi4 系 哺育类 …

韵律参数预测 语言特征 声学模型 HMM模型训练 声学特征 (约1.5小时语音) 音节,声调,前音节声调,后音节声调 该音节所在词的词性,词长,在短语中前、后位置(音节数) 该音节所在短语长,短语在句中前后序号,前位置(音节数) 平价商店选购。 声学模型 HMM模型训练 声学特征 (约1.5小时语音) 句子基频曲线、音节位置时长、能量参数、谱参数 1 句子基频曲线 2 音素时长参数 3 能量参数 4 谱参数 基频

韵律短语预测 实验材料: 实验结果及观察: 8874句(8.3小时语音) 考察标点 、,:;!?。 破折号及省略号 单元中的音节数 单元百分率(%) 100ms以上停顿间单元 相邻的两标点间单元 300ms以上停顿间单元 实验材料: 8874句(8.3小时语音) 考察标点 、,:;!?。 破折号及省略号 100ms以上的停顿:7093个 300ms以上的停顿:3610个 实验结果及观察: 99%的逗号处伴随有100ms以上的停顿  标点是重要的停顿标志 57.4%的停顿(100ms以上)非与标点相连  仅标点处停顿显然是不足够的 86%的韵律短语长为3至9个音节

[坚决[实行/[[依[法]][办事]]]] 韵律和句法结构的交叉依赖性 [坚决[实行/[[依[法]][办事]]]] 韵律短语 句法短语 1 交叉 0 交叉 句法树 实验材料: 1091句(3小时语音) 句子选自PENN Treebank n交叉:n个句法分枝横切一韵 律短语; 0交叉表示韵律短语是 一句法短语的子串 实验结果: 句法分枝交叉韵律短语的次数 按停延长划分韵律短语 观察: 大约有26.7%的停顿(短语内含1-5交叉)是不能由句法结构来预测。

语音数据库 旅行会话 人民日报 语料库 语音数据库 (20小时) 句子选择算法 句子集 录音 语音分段及声学参数提取 (约15000句) 最大化语言和音韵特征的覆盖率 录音 (防音室、女性播音员) 语音数据库 (20小时) 语音分段及声学参数提取

合成样本演示 您好,下面是几例有关旅行会话和新闻方面的汉语语音合成样本. 您是用现金还是用信用卡付款? 请告诉我您的姓名和房间号。 (伦敦/纽约综合讯) 国际油价星期二在纽约隔夜市场大幅飙升,收盘价首度突破100美元,盘中一度触及每桶100.10美元的历史新高。 美国民主党总统参选人奥巴马 先后赢得威斯康辛州和夏威夷州初选,挫败对手希拉里,这是他自“超级星期二”以来取得的连续第10场胜利。共和党方面,麦凯恩再次压倒对手赫卡比,进一步锁定他在共和党总统参选人提名战中的胜局。

陈述-疑问语调相互转换 (分析合成例子) 过路客照相 陈述句  疑问句 陈述句  疑问句 红鼻头没权

韵律再合成 都快八点了。 都快八点了。 都快八点了。

需要强化虚词处理 我想起来了 例文 我想 起来了 语音波形 【一般动词】 基频波形 起来 语音波形 我 想起来了 【趋向动词】 基频波形

处理虚词 从韵律特征上看,虚词和实词存在一定区别; 从会话角度看,处理好虚词更能体现口语化。 与动词相关联的例子: 【了着过】安排了/过 /着 三次报告会 【动介】安排给 /在 南方 【重叠】安排安排 生活 【结果】安排得着/ 不着/ 成/ 不成/ 好/ 不好/ 得上/不上/下/不下 生活 【趋向】安排上来/上去/下来/下去/进来/进去/出来/进去 几个客人 【趋向】安排几个客人 上来/上去/下来/下去/进来/进去/出来/进去 【趋向】安排上/下 / 进/出 几个客人来 /去 【趋向】安排得过来 /不过来 /得开 /不开 /起来 球赛 【趋向】安排起 球赛 来 了 【趋向】安排到 计划里 去 / 来

结束语 介绍了XIMERA汉语语音合成技术,包括文本规范化、分词标注、拼音生成、韵律控制及语音数据库方面的工作。 简要介绍为实现会话语音合成的相关工作。 语音合成对语言学研究的一些期待: 语言解码能力提高合成语音的通讯能力 统计技术和(知识)规则相结合 语言学研究成果工程应用