何 姗 北京师范大学 & 爱荷华大学 陈梦恬 爱荷华大学

Slides:



Advertisements
Similar presentations
经过同学们近两周的笔袋制作材料搜集、 设计、制作,我们的作品终于完工啦!大家 迫不及待地展示并相互交流了自己的作品。 经过老师和同学们共同参评和投票,我 们最终选出了一、二、三等奖作品。 下面就请随我们的镜头一起来看一看我们 的杰作吧! 自制环保笔袋交流评比.
Advertisements

四川财经职业学院会计一系会计综合实训 目录 情境 1.1 企业认知 情境 1.3 日常经济业务核算 情境 1.4 产品成本核算 情境 1.5 编制报表前准备工作 情境 1.6 期末会计报表的编制 情境 1.2 建账.
2014 年职称英语等级考试 综合类精讲班 主讲:叶老师. 职称英语考试与复习方法 一、职称英语考试 1. 职称英语考试的特点: a 综合英语分为 A B C 级 b 职称英语考试和教材的关系 c 可以借助字典 d 送分( 分) (1) 词汇选项(可能送 3—8 分) (2) 阅读判断.
主编:邓萌 【点按任意键进入】 【第六单元】 教育口语. 幼儿教师教育口 语概论 模块一 幼儿教师教育口语 分类训练 模块二 适应不同对象的教 育口语 模块三 《幼儿教师口语》编写组.
第一組 加減法 思澄、博軒、暐翔、寒菱. 大綱 1. 加減法本質 2. 迷思概念 3. 一 ~ 七冊分析 4. 教材特色.
大学英语等级考试 听力攻略 主讲: 外语教学部 秦诗雨 大学英语等级考试交流群:
冀教版四年级数学上册 本节课我们主要来学习 2 、 3 、 5 的倍数特征,同学们要注意观察 和总结规律,掌握 2 、 3 、 5 的倍 数分别有什么特点,并且能够按 要求找出符合条件的数。
2 、 5 的倍数的特征. 目标 重点 难点 关键词 2 、 5 的倍数的特征 1 、发现 2 和 5 的倍数的特征。 2 、知道什么是奇数和偶数。 能判断一个数是不是 2 或 5 的倍数。 能判断一个数是奇数还是偶数。 奇数、偶数。 返回返回 目录目录 前进前进.
2 、 5 的倍数特征 集合 2 的倍数(要求) 在百数表上依次将 2 的倍数找出 并用红色的彩笔涂上颜色。
PUTONGHUA YUYAN JICHU YU YINGYONG JIAOCHENG
英文打字入門 大華技術學院 資訊管理系 指導老師:陳信如 老師 學生:資五A 李姿諭.
舞动青春 落叶归根 大学生职业生涯规划书 BUSINESS ENGLISH 韩慧敏.
山东英才学院 SHANDONG YINGCAI UNIVERSITY
现 代 汉 语 中文系汉语教研室.
绪论 现代汉语概说.
现代汉语 第一章 绪论 2017/3/10.
网页设计师的职业成长规律 主讲:刘万辉 淮安信息职业技术学院.
Three topics The strategy system
语料库语言学简介 Luo Ling
第一章 现代汉语概述.
广元市国家二类城市 语言文字工作评估验收 档案归集培训会
案例2 胸卡的制作. 案例2 胸卡的制作 知识要点: 学习重点及制作思路 学习目的: 邀请函的制作步骤: 1.掌握邮件合并功能 2.掌握比较并合并文档方法 3.掌握页面插入背景图 4.熟练使用文本框 知识要点: 1.邮件合并功能 2.文档中插入域内容 3.文本框的使用 技能要点: 1.域、文档部件操作.
第八章 综合性语言学 主要内容:本章介绍了几门最重要的综合性语言学科的概况和主要内容。需要重点掌握的内容有:第一节:心理语言学发展的主要动力、心理语言学的三大流派、思维对语言的影响、言语生成的阶段和言语理解的过程。第二节:社会语言学和文化语言学的兴起的原因、社会语言学和文化语言学的差异、社会语言学和文化语言学的主要内容。第三节:应用语言学的研究范围、确立共同语的依据、语料库加工的主要内容、语言信息处理的主要应用领域。
对 培训者 培训的理解 丁革建
PressDisplay各语种报纸库.
关于本门课程.
常用逻辑用语复习课 李娟.
《小学教育学》 模块二 小学教育源流 第五单元 小学教育走向的探究成果分享 自主学习指南.
苏教版(国标本)第六册 习作四 南京市五老村小学   王咏慧.
基于学习者语料库的 外语教学研究 北京师范大学外文学院 程晓堂.
如何利用互联网的英语学习资源.
按时到课 勤记笔记 来得早一点 走得迟一点 记得牢一点 期末考评 期中考试 (60%) 期末考试 平时考核 (40%)
在PHP和MYSQL中实现完美的中文显示
How Do You Study For A Test ?
课程与编码:语言学与应用语言学 张露茜(博士) 浙江工商大学 外国语学院
普通话 台语 广东话 白捷 CHIN301班.
语料库及其基本操作 杨林伟 烟台大学外语教育技术研究中心.
单元解析:教材主编 牛长清.
上课内容:自然拼读 上课时间:每周六晚19: :30 上课老师:尹岩老师 自然拼读: 自然拼读法又称“Phonics”, 它不仅是以英语为母语国家的孩子学习英语读音与拼字,增进阅读能力与理解力的教学法,更是以英语为第二语言的英语初学者学习发音规则与拼读技巧的教学方法。
陈新仁 南京大学外国语学院 语言学之家: 基于语料库的语用学研究 陈新仁 南京大学外国语学院 语言学之家:
用event class 从input的root文件中,由DmpDataBuffer::ReadObject读取数据的问题
现 代 汉 语 绪 论 现代汉语课程组编.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
京师数学大讲坛 第六讲 北京师范大学 数学科学学院
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
毕业论文答辩 答辩学生:宝藏PPT 指导老师:XXX.
C语言程序设计 主讲教师:陆幼利.
2019/4/16 关注NE官方微信,获取更多服务.
职场培训●工作计划●汇报总结●项目策划 明确目标 精准出击 动态 红黑双色,版式工整,通用实用,动态页面
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
河北大学申请博士生导师 人员基本情况 彩色照片 小二寸 免冠 一、近五年科研项目情况 姓名:张 芳 出生日期: 职称:
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
更新教学理念,提高教学有效性 感城中心学校 陈利平.
中国风背景论文答辩模板 某大学某某信息学院 答辩学生:代用名 指导老师:代用名 答辩时间:201X年1月30日
北师大版五年级数学下册 分数乘法(一).
Semantic Relations between Words
双语例句搜索 句库+巨酷 Web: Beijing 2008.
Unit 4 At the farm Part A Let’s talk 马兰屯镇林桥小学 谢素珍.
礼courtesy Value of the Month每月一德.
Visual Basic程序设计 第13章 访问数据库
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
聚英共识联 跨学科学习计划 2012.
大学生口语学习风暴讲座 ——Blair.
基于列存储的RDF数据管理 朱敏
论文题目写在这里 题目太长分两行写也可以哦 - 国际经济与贸易 指导老师
毕业论文答辩模版 电子信息专业 2015级本科08班 北京大学 论文宝 答辩人: 教授 导师: 深蓝与灰白搭配 简洁严谨学术风格
毕业论文答辩模版 北京大学 某某某某专业 2015级本科08班 论文宝 答辩人: 教授 导师: Peking University
辞典类 Oxford English Dictionary 牛津在线英语大辞典
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

何 姗 北京师范大学 & 爱荷华大学 陈梦恬 爱荷华大学 浅议汉语口语语料库的选材问题 何 姗 北京师范大学 & 爱荷华大学 陈梦恬 爱荷华大学

研究思路 选题缘起 研究问题 选材设想 建设学习者中介语口语语料库的重要意义 对汉语口语的研究是基础,但现有研究不够充分 需要建设本族语者口语语料库以深化研究 选题缘起 汉语口语语料库的建设目标是什么? 汉语口语语料库应该收录什么语料? 研究问题 广泛选取具有代表性的语料,构建大型普通话口语平衡语料库 选材设想

建设中介语口语语料库有重要意义 语音研究 对于口语语体特征的掌握情况 横向了解学习者在不同口语交际场景下的语言能力 纵向研究学习者的口语水平的发展情况 需要现代汉语口语研究作为基础 教材编写 辞书编纂 课堂教学

口语教学研究现状 对汉语口语研 究的关注不足 在汉语教学中对 口语的重视不够 辞书对口语的说 明标识存在问题 语法、词汇、语用、 语体方面的研究不够 深入。 (韩荔华,1994;曹炜, 2003;李如龙,2007; 冯胜利,2012) 学习者缺乏语体意识,书 面语存在口语化倾向,口 语交际中又容易出现失误。 (丁金国,1997;1999; 2010;冯胜利,2003(1); 2003(2)) 《现代汉语词典(第五版)》某些 标识<口>的词语不具有口语词的语 义特征,或是口语色彩不明显;某 些具有明显口语特征的词语却并未 标志;某些词语虽然具有口语特征, 但同时带有较强的方言特色,不应 该简单标识为口语词;《现代汉语 常用口语词典》和《口语习用语功 能词典》收录的口语词口径不一, 且数量有限,包含大量方言词、口 语色彩不强的惯用语。 (贺俊岚,2008;宋婧婧,2015) 总体来说,相关研究的数量还比较少,研究对象以北方话或北京话的多,研究通语的少;研究方法上,依靠主观语感和经验的多,定量分析的少,例证式的研究多,调查分析得少。 (宋婧婧,2015;杨翼等,2016)

现有汉语口语语料库资源概况 序号 名称 口语语料 口语语料来源 1 北京大学中国语言学研究中心CCL语料库(文本语料库) 7.8亿 1982年北京话调查资料、对话(如:李彦宏马化腾马云精彩对话)、电视访谈(鲁豫有约)、电视电影(如周星驰喜剧剧本选、百家讲坛)、相声小品(赵本山、郭德纲) 2 北京语言大学BCC现代汉语语料库(文本) 30亿 2013年新浪微博 3 中国传媒大学有声媒体语料库(录音/文本) 2亿 34039个广播电视节目的转写材料 4 国家语委语料库 (文本) 300万 口语语料应该是书面语和表义连贯明确,能够用书面语转述的口语语料(如剧本、相声、谈话录、演讲录等),并以前者为主,后者为辅。 5 北京语言大学北京口语语料库(录音) 186万 北京市区和城郊500位居民的独白 6 朗读语篇语音语料库ASCCD(录音) 约7500 10位发音人朗读的18篇文章 7 自然口语独白语音语料库CASS(录音) 6小时 清华大学广播站提供磁带,内容包括学校讲座、学生自由讨论、公共会议,有对话,但大部分为独白 8 台湾国立政治大学NCCU Corpus of Spoken Chinese 27段对话 国语、客家话、.话

现有口语语料库资源存在不足 资源有限,数量较少; 大部分语料都是经过转写的文本材料,包含原始音频 材料的语料库很少; 对于口语语料的判定没有统一的标准,各个语料库收 录口语语料的口径不一; 含有语音文件的语料主要是电台、电视台的播音员、 主持人的媒体语料,普通话在日常生活中的使用情况 没有足够语料可供参考。 对于现代汉语口语情况的记录缺乏全面性和客观性, 不利于研究的深入。

统计和分析特定语言单位在口语中的用法、频率和分布情况 建立口语语料库要解决什么问题? 为汉语作为第二语言的教学和研究提供参考 统计和分析特定语言单位在口语中的用法、频率和分布情况 对比分析 口语的特征 为非目的语环境下的学习者提供口语输入 了解现代汉语普通话的整体情况

什么样的口语语料库 才能达到建设目标? 口语 语料 多样性语料 普通话 自然

现代汉语普通话 定义:以北方话为基础,以北京语音为基础音, 以典范的现代白话文著作为语法规范的现代汉语 标准。 上述定义看似很明确,实际上有很多值得进一步 探究的问题。

语音以北京语音为基础音 以北京话的语音系统为标准,并不是把北京话一切 读法全部照搬,北京话仍有许多土音和异读音现象。 轻声儿化以及某些音变 ,一直是普通话规范中的争 论焦点。什么样的儿化是标准的 ,什么样的儿化是 不标准的 ,哪些轻声、音变可以进入普通话 ,哪些轻 声、音变必须规范掉 ,现在并没有权威的说法。 (谢俊英,1999) 问题一:大部分南方人不说“这儿、那儿、哪儿”, 而是说“这里、那里、哪里”,很多方言地区的人 在说普通话时没有儿化,那他们说的是普通话吗?

词汇以北方话为基础 普通话的词汇系统以北方话为基础 ,但这个基础方言的词汇系 统内部存在比较大的差异;另外,不少其他方言(粤语、吴语) 的词汇也逐渐进入到普通话词汇系统中;哪些是普通话的规范 词,没有明确的判断标准。 北方大部分地区口语都说“孩子”,《现汉》收了“小孩儿”, 说明普通话可以说“小孩儿”,但必须儿化。西北、西南官话 和非官话则有种种说法,但是这些地区的人在说普通话的时候, 往往都说没有儿化的“小孩”。他们以为这就是普通话,却完 全想不到北方人是从不这么说的。(汪平,2013) 问题二:方言区的人说普通话,实际上常常夹杂既非方言也非 普通话的说法,但是并不影响理解和交流,那么他们说的是普 通话吗?

以典范的现代白话文著作为语法规范 虽然说白话文相对于文言文更接近于口语,但是白 话文著作主要体现的还是书面语语法; 正如播音语言虽然以口头形式表达,但基本上使用 书面语法,其实是“念”书面语,而不是“说”话, 所以不是真正的口语;(叶军,1997) 问题三:普通话的定义中,语音指的是口语,语法 指的是书面语,词汇不明确,那么普通话到底是口 语还是书面语? 普通话口语如何界定?

因为语言不是静态封闭的系统,所以绝对性的界 定必然与语言的动态发展性相悖,所以不可能在 普通话和方言、书面语和口语之间划定一道清晰 的界线; 不同地区、不同阶层的人对普通话有不同的认知; 在中国大部分地区,汉语方言还占有主导地位, 普通话的普及程度存在地域差别,普通话水平受 到说话人方言、语言态度、受教育程度等多种因 素影响。

普通话测试评级标准 一级 会说相当标准的普通话,语音、词汇、语法很少差错; 二级 会说比较标准的普通话,方音不太重,词汇、语法较少差错; 三级 会说一般的普通话,不同方言区的人能够听懂。 《新时期的语言工作》(1986)

中国语言文字使用情况调查 (谢俊英,2011) 判定原则:语音、词汇、语法三者兼顾 ,但把语音作为判定是否是普通话的首要条件,只要语音基本上是普通话的音系 ,就可以认为被调查者说的是普通话。 三省 2430份问卷 6928份入户调查 普通话水平/地区 河北 江苏 广西 流利,准确 73.30% 70.67% 80.75% 熟练使用,个别发音不准 37.14% 13.60% 10.30% 使用较熟练,方言音较重 17.19% 35.18% 41.11% 基本能交谈,但不太熟练 17.72% 24.39% 20.30% 能用普通话交谈 27.95% 15.59% 26.29%

普通话并不是一个标准明确,界限明晰的封闭系统,因此在描写和研究中都应该将普通话系统视为一个典型范畴,一个包含典型成员(较为标准的普通话)和边缘成员(较不标准的普通话)的连续统。 电台、电视台播音员和主持人的普通话发音标准,表达较为规范,是标准普通话的代表,但是和自然口语有一定差距;方言区普通民众的发音可能不太标准,表达也带有方言特色,但是他们使用普通话进行的日常交际是更具代表性的口语语料。 因此,现代汉语口语语料库应该广泛取材,而不是以语音为标准将普通话狭义地限定于标准普通话。

汉语书面语和口语存在明显的差别,根据冯胜利 (2006)的研究,书面语至少在表达正式的语体 功能、语体的典雅与词语长短的对应关系、嵌偶 单音词的遴用、合偶双音词的使用、文言古句型 的选用五个方面特征。 如果在和朋友闲谈、陪长辈聊天、在正式会议发 言、和老师同学讨论专业问题时都以播音式的语 言面貌出现,必然是不真实、不自然,让人难以 接受的。也就是说,口语的表现会根据会话双方、 交际场景的差异在正式程度、庄典程度等方面产 生差别,因此除了考虑说话人的多样性之外,也 应该保证交际场景、交际目的、会话双方关系等 方面的多样性。

国外语料库口语语料选材调查 口语语料库在建设在国外起步较早,利用大型语料库对 口语进行的研究已经取得了不少成果,如Longman Grammar of Spoken and Written English(1999)和 Cambridge Grammar of English: A Comprehensive Guide Spoken and Written English Grammar and Usage(2006) 对于建设口语语料库,国外有不少成功经验值得借鉴, 因此我们对50多个语料库进行了调查,重点关注被收录 口语语料的类型,以期为汉语口语语料库的建设提供一 些参考。

语料库调查结果 50个语料库中除了英语语料库(英国、美国、新西 兰、新加坡)之外,还有苏格兰语、西班牙语、葡 萄牙语、意大利语、法语、俄语、乌克兰语、波兰 语、德语等语言; 其中包含通用语料库和专门语料库,如ANC/BNC等 大型国家语料库(14个)和SBCSAE/ACAMSNAE等专 门的口语语料库(21个); 共计35个语料库收录了口语语料(音频文件、经过 转录文本文件和其它文本文件),话题涉及政治、 体育、交通、学习、家庭、购物、工作等; 基本上所有口语语料库都考虑到了说话人、交际场 景的多样性。

语料的其它来源还包括布道、导游词、电影对白、课堂教学、朗读、讨论、推特、网页、研讨会等。

总结 加强现代汉语口语研究; 转换规定性的研究视角,重视描写性的基础工作; 将普通话视为一个开放性的典型范畴; 语料库研究应该基于大规模自然语料; 支持汉语作为第二语言的教学。

参考文献 曹炜. 现代汉语口语词和书面语词的差异初探[J]. 语言教学与研究, 2003(06):39-44. 丁金国. 对外汉语教学中的语体意识[J]. 烟台大学学报:哲学社会科学版, 1997(1):89-96. 丁金国. 再论对外汉语教学中的语体意识[J]. 语言文字应用, 1999(02):28-32. 丁金国. 语体意识及其培育[J]. 当代修辞学, 2010(06):31-38. 冯胜利. 语体语法:“形式-功能对应律”的语言探索[J]. 当代修辞学, 2012(06):3-12. 冯胜利. 韵律制约的书面语与听说为主的教学法[J]. 世界汉语教学, 2003(01):87-97. 冯胜利. 书面语语法及教学的相对独立性[J]. 语言教学与研究, 2003(02):53-63. 韩荔华. 口语、书面语再谈[J]. 北京第二外国语学院学报, 1994(5):61-65. 贺俊岚. 对外汉语口语词典的收词、释义、示例研究[D]. 暨南大学, 2008. 李如龙. 关注汉语口语词汇与书面语词汇的研究[J]. 陕西师范大学学报:哲学社会科学版, 2007, 36(2):110-116. 宋婧婧. 现代汉语口语词特征及其认定原则与方法[J]. 厦门理工学院学报, 2015(6):62-68. 汪平. 试论书面语与口语、方言、普通话的关系[J]. 中国方言学报, 2013(1). 谢俊英.中国语言文字使用情况调查中有关普通话的几个问题[J]. 语言文字应用,1999(4) 谢俊英.普通话普及情况调查分析[J]. 语言文字应用,2011(3) 杨翼, 李绍林, 郭颖雯,等. 建立汉语学习者口语语料库的基本设想[J]. 汉语学习, 2006(03):58-64.

谢谢! Thank you!