Presentation is loading. Please wait.

Presentation is loading. Please wait.

国内英语教学用多模态语料库建设现状 - 何美 20130422. 语料库 语料库是指按照一定的语言学原则,运用随机 抽样方法,收集自然出现的连续的语言运用文 本或话语片断而建成的具有一定容量的大型电 子文库。 关于语料库的三点基本认识:语料库中存放的 是在语言的实际使用中真实出现过的语言材料; 语料库是以电子计算机为载体承载语言知识的.

Similar presentations


Presentation on theme: "国内英语教学用多模态语料库建设现状 - 何美 20130422. 语料库 语料库是指按照一定的语言学原则,运用随机 抽样方法,收集自然出现的连续的语言运用文 本或话语片断而建成的具有一定容量的大型电 子文库。 关于语料库的三点基本认识:语料库中存放的 是在语言的实际使用中真实出现过的语言材料; 语料库是以电子计算机为载体承载语言知识的."— Presentation transcript:

1 国内英语教学用多模态语料库建设现状 - 何美 20130422

2 语料库 语料库是指按照一定的语言学原则,运用随机 抽样方法,收集自然出现的连续的语言运用文 本或话语片断而建成的具有一定容量的大型电 子文库。 关于语料库的三点基本认识:语料库中存放的 是在语言的实际使用中真实出现过的语言材料; 语料库是以电子计算机为载体承载语言知识的 基础资源;真实语料需要经过加工(分析和处 理), 才能成为有用的资源;

3 语料库驱动学习 在 20 世纪 90 年代初 Tim Johns 提出一种新的基于语料 库数据的外语学习方法 : 数据驱动学习( data-driven learning, 简称 DDL )。其主要思想是引导学生对语料 库数据进行观察,检索,自我发现语言使用规律,以 自下而上的方式归纳语法规则和语用特征 优点:数据驱动学习改变了以往传统的单向灌输的教 学模式,提供真实的语言实例,激发学生的学习兴趣, 通过语料库检索,培养学生自主学习和自我解决问题 的能力,达到辅助英语教学的最终目的

4 国内传统文本语料库教学应用 - 理论研究综述 21 世纪初,国内一些学者 ( 李文中 1999 ,朱乐红, 2000; 何安平, 2001) 开始关注于语料库在英语教学中的应用研究。李文中, 濮建 忠( 2001 )率先提出语料库索引在英语教学中的三种方式; 2004 年王金栓探讨语料库驱动学习英语教学新模式;同年首届中国语 料库语言学与英语教育教学研讨会在广州华南师范大学外文学院 召开, 对语料库语言学与英语教育教学的各个议题展开了激烈讨 论,极大地促进了语料库的英语教学研究;目前国内关于语料库 应用于英语教学的研究中所涉及的内容有词汇教学、语法教学、 语音拼写教学、写作教学翻译教学、口语教学、中介语研究、学 习模式、教学模式改革、话语和语篇研究等,曾永强( 2001 ) 《基于语料库的适应性学习模式》,徐曼菲( 2004 )《图示理论、 语料库语言学与外语教学》、卫乃兴,李文中,濮建中 (2005) 《语料库应用研究》、梁茂成,李文中,许家金《语料库应用教 程》、潘潘( 2012 )《基于语料库的语言研究和教学应用》等 。

5

6 国内传统文本语料库教学应用 - 语料库建设开发综述 由卫乃兴、李文中和濮建忠等人首次在国内实现了语 料库资源的在线查询、检索和免费共享, 实现了 4 个语 料库的 700 多万词的文本资源 KWIC 网络在线转换和实 时传送与共享, 开发了数据库学习系统 现在在国内已 建成多个大型英语语料库:中国子语料库,中国英语 学习语料库,大学学习者英语口语语料库,中国专业 英语学习者口语语料库,中国英语语料库,中学英语 口语语料库,公共英语等级考试口语语料库等,这些 英语语料库都与中国的外语教学和外语学习紧密相联。

7 传统文本语料库教学应用 “ 瓶颈 ” 目前基于语料库的教学模式和实践仍处于探索阶段, 且 教学应用研究多关注于词汇教学。 传统语料库多为文本进行转写标注,其应用于直接应 用于日常语言教学却仍有不少障碍,主要问题包括: ( 1 )现有文本语料库主要为调查和研究语言而设计和 建立,其规模大、话题和语域种类繁多,但内容通常 不能与语言教学要求直接接轨;( 2 )语料库的体例与 传统的教材体例相距甚远,从中提取的词语索引行也 往往使初学者感到过于纷杂和不完整;( 3 )语料库的 标注体系,如口语语料库中的诸多音韵标记,通常令 人费解;( 4 )语料库只显示文字和数据,而语言教学 却已进入了 “ 多媒体 ” 时代 - 何安平( 2009 )

8 多媒体 VS 多模态 内容的载体即逻辑媒介来界定某个内容是否是 多媒体材料。逻辑媒介指在物理媒介上装载内 容或信息的编码手段, 如文字、模拟音频流、 数字音频流、图像、视频流等。 模态在本文里指人类通过感官如视觉、听觉等 跟外部环境如人、机器、物件、动物等之间的 互动方式。

9 多模态语料库 - 多模态语料库是建立在 “ 言语理论 ” 基础之上的, 以 言语活动为研究对象, 以从原始数据中抽取信息和 知识为手段, 以语境模型为驱动的囊括整个言语活 动的语言、声音、图像和动作的多媒体语料库(张 霄军, 2007:36 )。 教学应用优势: 多模态语料库的语料不再仅限于文本, 以多媒体素 材包括音频和视频为语料, 在多元语境中反映语言在 语音、语义和语用等方面的全貌,学生更直接的体 验语言使用的多模态语境。 通过多媒体素材语料进行检索,提高学生的自主性 改变以往灌输式的教学方式,有利于建设 “ 以教师为 主,以学生为辅 ” 的教学模式。

10 国外多模态语料库的建设 早在 2000 年, NIMM 工作组就当时现存多模态语料库,转写软件, 标注工具进行调查,发现全球范围内已存在 64 个多模态语料库,36 个用于面部表情和言语多模态研究, 28 个研究身体姿势和言语多 模态研究,并已有 21 个标注方案,现存的多模态语料库主要用于 多模态话语分析,视听识别系统,人机智能对话领域的,但是当 时多模态语料库的研究多是仅限于两种模态的分析,标注软件, 研究成果应用范围不广。经过十几年众多学者的努力,现在已建 有用于不同用途的可以分析多种模态的大型语料库工程,包括用 于多模态话语分析的 CID 语料库, D64 语料库, IFADV 语料库, Smartweb 语料库用于研究人机智能对话技术,也有应用其他领域 的: AMI 会议语料库( 3 个不同会议室 100 小时的会议内容,用于 研发浏览先前会议内容的技术), CUBE-G 语料库(由德国和日 本联合建设,用于研究多模态文化差异), Fruits Cart Corpus ( 13 个成员的任务生成性对话,用于研究语言生成)。

11 国外多模态语料库检索软件开发 许多应用于多模态语料库标注和检索的软件: ANVIL , Elan , MacVisSTA , DRS , Exmeralda ,同时还有其他功能的软件, Transformer 用于文件格式转换, speechware 语料库转写软件, C-BAS 用于标注编码。 Elan 软件是荷兰纽梅因马普心理语言学研究所开发的一 个多媒体转写标注软件,在话语分析、态势语言、语言存档、口语语料 库建设、濒危语言或方言的保存等方面被广泛使用。 Elan 支持多种音频 和视频文件格式的转写和标注,媒体与文本直接关联,一一对应,可以 无限添加标注;支持大字符集 Unicode 编码汉字、国际音标等各种字符的 输入和显示;转写标注内容与数据库紧密结合,使用者可以根据需要进 行各种形式的检索;许多多模态语料库的建设中都是用了该种软件。而 多模态语料库应用到外语教学的研究也起步于 2000 年。意大利系统功能 语言学和多模态话语分析专家 Anthony Baldry 和其他学者共同研发 “ 多模 态语料库标注系统 ” ( Multimodal Corpus Authoring System ,简称 MCA ) 该信息检索工具基于系统功能语言学和多模态话语分析理论,以 “ 帧 ” 为基 本单位刻画了影视语篇的语义内容和类型结构,从而成功地表征了多媒 体信息的语义内容。如今在意大利、新加坡等国,该多模态检索系统已 经在多所高校的外语电化教学中得到了应用。

12 国外教学多模态语料库建设 2008 年 12 曰合作建设的教学语料库 SACODEYL 多模态语料库是 多模态语料库在外域教学中的直接应用。其在欧共体资助下,由 英国、法国、德国、意大利、立陶宛、罗马尼亚和西班牙 7 个国 家的 4 所大学于。该库收录了欧洲 7 国的青少年语言,是世界上第 一个将数据驱动学习模式付诸实践的多语种多模态语料库。与其 他语料库相比,该库有其独到之处:( 1 )提供多种语料库工具 和灵活多样的检索形式;( 2 )可进行文本和多模态视频间的自 由切换;( 3 )用户可自定义标注;( 4 )补充了丰富的教学活动; ( 5 )可免费在线使用同时多模态语料库建设中的其他一些问题 也在国外引起了广泛关注。如:多模态语料库标注信度测试,多 个多模态语料库标注软件间文本兼容,多模态语料库网络共享及 多模态语料库的著作权问题都有了深层次的研究。

13 国内多模态语料库建设 李文中教授带领开发的国内建成语料检 索与音视频定位同步播放系统,整合了 多媒体技术,支持关键词和场景检索。 杨林伟、伍忠杰设计的新闻多媒体语料 库基于 B/S( 浏览器 / 服务器 ) 架构模式均对 语料库的建设和共享具有积极的促进作 用。

14 多模态应用于教学 目前国内关于多模态语料库应用于教学 的研究有两种: 一种是间接应用,将多模态语料库的研 究成果应用于英语教学。 另一种是直接应用,将多模态语料库直 接应用于英语教学。

15 间接应用 王立非、文艳( 2008 )应用 Elan 软件对第二语 言教师课堂话语,母语演讲者开场片段进行多 模态分析,建立小型多模态语料库研究音韵特 征是如何和话语的结合方式; 刘芹、潘鸣威( 2010 )以多模态话语分析理论 为基础,拟建立中型多模态口语语料库,从多 个标注维度设计多模态口语语料库,以对学生 口语作全方位、多层次的剖析,以全面反映大 学生的英语口语水平。

16 直接应用 李学宁、马利霞( 2010 )探讨了 MCA 多模态 检索及其在外语电化教学中的应用的可能性; 吴进善( 2010 )提出多媒体教学平台建设的理 论框架,将多媒体语料检索和大学教学相结合; 河南师范大学李文中( 2010 )实现了多媒体语 料库的教学应用,及白晧,樊晓红( 2012 )基 于该语料库的实证研究。 杨林伟,伍忠杰( 2012 )对 Web 多媒体语料 库教学应用设想

17 多模态语料库教学应用研究总述 虽然国内多模态语料库教学研究刚刚起步,但 是引起广泛关注,多模态语料库教学应用主要 在于理论支持研究上,在语料库建设和软件开 发上较国外发展仍比较落后。李文中教授带领 建立的多媒体语料库仅限于单机使用,应用范 围有限。杨林伟等建设多媒体语料库现只能支 持音频检索。 多模态语料库开发和应用需要语料库语言学家、 外语教学专家和计算机工程师的通力合作。

18


Download ppt "国内英语教学用多模态语料库建设现状 - 何美 20130422. 语料库 语料库是指按照一定的语言学原则,运用随机 抽样方法,收集自然出现的连续的语言运用文 本或话语片断而建成的具有一定容量的大型电 子文库。 关于语料库的三点基本认识:语料库中存放的 是在语言的实际使用中真实出现过的语言材料; 语料库是以电子计算机为载体承载语言知识的."

Similar presentations


Ads by Google