语言文字信息管理工作 李宇明 2004.8.19
工作思路和工作目标 工作思路 工作目标 经过四五年的努力,争取: 以语言文字 规范标准 制定为核心 以信息化 为主线 以评测 认证 为抓手 以语言工程 建设和 科学研究 为基础 工作目标 经过四五年的努力,争取: 建成服务于教育和国家信息化的语言文字坚实平台 满足社会对语言文字规范标准的基本需求 进一步提高语言信息处理技术及其应用水平 促进社会语言生活健康发展
一 以语言文字规范标准制定为核心 国家语言文字工作的任务包括: 制定规范标准具有核心性、基础性的地位。 一 以语言文字规范标准制定为核心 国家语言文字工作的任务包括: 制定规范标准 推行规范标准 制定规范标准具有核心性、基础性的地位。 王湛同志(前任国家语委主任)2001年在全国语委办主任会暨普通话水平测试工作汇报会上讲话指出: “语言文字工作的具体任务归结起来大体可以分为两大类,就是制定规范标准和推行规范标准。制定规范标准具有核心性、基础性的地位,只有根据社会语文生活的发展和需要,制定、完善科学的、切合实际的语言文字的规范和标准,推行标准和规范化建设才有基础。”
1.标准化工作的重要性 我国加入世贸以来,标准在提升我国产品的国际竞争力,促进国际贸易,以及合理保护国内市场等方面的作用越来越明显。可以说,规范标准是“第三海关”。 语言文字标准化是语言文字规范化的升华,标准化是适应语言信息化的要求。 教育的大发展 媒体的大普及 信息技术与产品的发展与更新 汉语的国际传播
2.已制定的规范标准 已发布的规范标准 建国以来制定的语言文字规范标准有100多项 在语文教育、新闻出版、辞书编纂、信息处理等方面发挥了巨大作用 有力促进了汉语汉字和少数民族语言文字的规范化和信息化 已发布的规范标准
语言文字规范标准体系
3. 语言文字标准化工作之不足 已制定、发布的规范标准缺乏系统性; 应用领域,特别是信息处理领域的规范标准不能满足实际需要; 标准制定周期过长,修订不及时; 标准制定前的基础研究薄弱; 没有形成制定语言文字规范标准的专门队伍; 社会对语言文字规范化的认识有待提高。
4. 语言文字标准工作的近期任务 * 加强语言本体的和各种应用性的规范标准建设,重视语言文字国际标准化工作。 如: (1)《规范汉字表》及汉字 基本属性规范体系 (2)积极推动中国汉字国际 标准化 (3)发布《中国语言生活绿皮 书》
《中国语言生活绿皮书》 语言生活重在引导。汉末熹平石经,唐代字样之学,史之证也。 尝试将一些科研成果、调查报告、软性的规范标准,以《中国语言生活绿皮书》的形式发表 与 “硬规范”相辅相成,共同推进社会语文生活健康发展,为社会语言文字应用提供服务、资源和工具。
一 以语言文字规范标准制定为核心 举 措 建章立制 确保规范标准制定和发布有章可循、规范有序,保证规范标准的科学性、权威性 一 以语言文字规范标准制定为核心 举 措 建章立制 确保规范标准制定和发布有章可循、规范有序,保证规范标准的科学性、权威性 队伍建设 组建全国语言文字标准化技术委员会,以市场为导向、以学者和用户为主体,有计划地加快语言文字规范标准制修订工作 工程建设 加强语言文字基础工程建设,为语言文字规范标准的制定提供坚实的平台 宣传普及 大力加强语言文字规范标准的宣传和普及工作,努力提高社会各领域的语言文字规范意识
全国语言文字标准化技术委员会组建工作 教育部语信司 全国语言文字标准化 技术委员会 汉语语音与 拼音分会 汉语语汇分会 汉语语法与 语篇分会 挂靠在社科院 语言研究所 主任委员:董琨 秘书长:李志江 汉语语汇分会 挂靠在 南开大学 主任委员:周荐 秘书长:杨琳 汉语语法与 语篇分会 挂靠在 北京大学 主任委员:沈阳 秘书长:詹卫东 汉字分会 挂靠在教育部 语言文字 应用研究所 主任委员:王宁 秘书长:陈双新 少数民族语言 文字分会 挂靠在中央 民族大学 主任委员:戴庆厦 秘书长:成燕燕 外语应用分会 挂靠在北京 外国语大学 主任委员:刘润清 秘书长:戴曼纯
知识鸿沟 二 以信息化为主线 数字鸿沟 社会鸿沟 科技鸿沟 经济鸿沟 二 以信息化为主线 数字鸿沟 社会鸿沟 科技鸿沟 经济鸿沟 知识鸿沟 信息技术成为当前的领先技术和从事科学研究必需的现代化手段,数字鸿沟带来科技鸿沟。 联合国教科文组织认为,新的信息技术为改进学习和教学、增加学习机会、提高教育质量、改善管理和办学提供了极大潜力,数字鸿沟加深了知识鸿沟。 信息产业是当前世界最为重要的经济增长点,数字鸿沟带来经济鸿沟。 数字技术的发明,使大数量、快速度、高质量地处理信息逐渐成为现实,信息将逐渐成为生活的凭借和生产的资本,对人类的生活与生产活动将发挥空前的作用。信息处理的水平常常代表着一个国家经济发展的水平。以信息产业为代表的高新技术产业,跃居国民经济中的首要地位。
中国互联网络发展状况统计报告 中国互联网络信息中心(CNNIC) 发布年月 1997-10 1998-06 1998-12 1999-06 1999-12 2000-06 2000-12 2001-06 2001-12 2002-06 2003-01 2003-07 2004-01 2004-07 联网主机数量(万) 29.2 54.2 74.7 146 350 650 892 1002 1254 1613 2083 2572 3089 3630 网民数量(万) 62 117.5 210 400 890 1690 2250 2650 3370 4580 5910 6800 7950 8700
中国互联网络发展状况统计报告 中国互联网络信息中心(CNNIC)
二 以信息化为主线 语言文字信息化是国家信息化的基础,因为语言文字是信息最为重要的载体。 二 以信息化为主线 语言文字信息化是国家信息化的基础,因为语言文字是信息最为重要的载体。 应当尽快掌握中国语言处理的核心技术,跨越与世界先进国家存在的数字鸿沟。 互联网是人类20世纪最为重要的发明。满足网络的语言文字需求,健康网络语言生活,成为语言文字工作的新任务。
二 以信息化为主线 1986年,我国计算机信息系统首席科学家汪成为提出“电子计算机软件也是语言文字工作”。 二 以信息化为主线 1986年,我国计算机信息系统首席科学家汪成为提出“电子计算机软件也是语言文字工作”。 钱学森进一步指出:“这项工作同语言文字工作的联系最密切,国家有关部门应该在这方面为国家上层决策提供设想和参考意见。”
二、以信息化为主线 规范标准制定,要自觉为信息化服务; 通过制定信息技术及其产品中的语言文字规范标准,来促进语言信息化; 善于利用信息化的手段和成果促进语言文字工作。
三 以评测认证为抓手 评测认证的必要性 语言文字规范从管人到管机器 语言文字规范标准的评测认证,反映了政府工作职能的转换 三 以评测认证为抓手 评测认证的必要性 语言文字规范从管人到管机器 语言文字规范标准的评测认证,反映了政府工作职能的转换 评测认证中心作为中介机构,可以有效地发挥市场导向作用 评测认证是促进产品优化的重要手段
三 以评测认证为抓手 国家语委语言文字规范标准测查认证中心已经组建,挂靠在教育部语言文字应用研究所。测查认证中心的工作任务是: 三 以评测认证为抓手 国家语委语言文字规范标准测查认证中心已经组建,挂靠在教育部语言文字应用研究所。测查认证中心的工作任务是: 开展语言文字规范标准符合性测查认证工作 汉字输入、汉字识别、语音识别与合成、汉字字库、机器翻译系统、词库、语文学习机等信息技术与产品遵循语言文字规范标准情况的测查认证; 报纸、期刊、杂志、图书、教材等出版物和产品包装说明等遵循语言文字规范标准情况的测查认证; 网络和影视屏幕、音像制品、电子出版物等遵循语言文字规范标准情况的测查认证; 其他语言文字应用成果遵循语言文字规范标准情况的测查认证。
三 以评测认证为抓手 开展语言文字规范标准咨询服务工作。 参与语言文字规范标准培训工作。
四 语言基础工程建设 为中文信息处理、语言文字规范标准制定、社会语言生活的监测引导、应用语言学研究等,打下坚实的基础。 四 语言基础工程建设 语言工程指各种各样的语言资源库 建设、完善语料库等各类语言数据库,集成语言资源,实现全国范围内的共建共享 为中文信息处理、语言文字规范标准制定、社会语言生活的监测引导、应用语言学研究等,打下坚实的基础。
四 语言基础工程建设 中华字符集和汉字属性库 四 语言基础工程建设 中华字符集和汉字属性库 中华字符集。搜集整理包括承载中华文化的所有文字和符号,解决这些字符的存储、输入、输出、检索等技术问题,服务于中华典籍数字化、图书馆和博物馆数字化。 汉字属性库。建设包括古今汉字、中外汉字各种信息的汉字属性多功能平台,满足基础教育、新闻出版、古籍整理等用字的需要,支持汉字的国家标准化、国际标准化工作。
四 语言基础工程建设 现代汉语语料库 现代汉语语料库是国家语委主持建立的国家级大型通用语料库。 其目的是服务于语言文字的信息处理、规范标准制定、学术研究、语文教育和语言文字的社会应用等。目前语料库规模近亿字,其中核心语料库为2000万字。 为充分发挥语料库的作用,需要对国家语委现代汉语语料库进行深度加工,并面向社会提供应用。
四 语言基础工程建设 动态语料库 着手建设动态流通语料库(汉语平面媒体语料库、汉语有声媒体语料库、汉语网络媒体语料库、汉语教育教材语料库、海外华人社区汉语语料库),对语言现象进行监测、分析、研究,为国家语言文字方针、政策的制定提供依据,为社会语言文字应用提供咨询服务。
四 语言基础工程建设 动态语料库 汉语平面媒体语料库由教育部语言文字信息管理司与北京语言大学合作共建的“国家语言资源监测与研究中心(平面媒体)”2004年6月30日正式成立。教育部副部长、国家语委主任袁贵仁为中心揭牌并讲话。
四 语言基础工程建设 普通话培训测试语音库 进行普通话培训测试的语音采样、加工、整理,建设各种语音语料库(如口语语音语料库、中介语语音语料库和普通话标准语音数据库等),为普通话培训测试的发展提供支持。 立项建设“地方普通话语料库” 。
四 语言基础工程建设 网络工程建设
5. 网络工程 根据袁贵仁同志在语言文字应用研究“十五”科研规划论证会上的讲话精神,完善中国语言文字网和地方网的网络系统,充分发挥网站功能。 第一,宣传国家语言文字工作的方针、政策; 第二,向社会提供语言文字工作的咨询和信息服务; 第三,实现网上语言文字远程教育,包括普通话的培训、测试,以及文字应用水平的测试等; 第四,实现全国语言文字工作和科研管理的网络化; 第五,规范标准发布的平台和征求社会意见、讨论语言文字问题的渠道; 第六,连结海内外语言文字学术研究的桥梁。
5. 网络工程 下一步的工作任务 (1) 发展电子政务(电子语委),健全语言文字工作政务信息化网络平台,建立完整、统一、规范的政务管理系统。 (2) 加速建立语言文字工作、语言文字应用研究的信息、资源库。 语言文字工作档案数据库; 语言文字应用研究论文、著作数据库; 中国语言学人才库;等等。 (3) 建设远程教育平台,发展规模化的网络教育。 普通话教学; 对外汉语教学; 语言文字规范标准应用教学; 语言文字应用研究专家学者讲座;等等。
5. 网络工程 几点希望 (1)进一步提高对语言文字工作系统政务信息化的认识 (2)充分发挥网络作用,逐步提升工作水平 (3)希望大家都能利用语言文字信息化的成果从事工作与学习
四 语言基础工程建设 工作举措 明晰知识产权:通过明晰知识产权和统一规范标准,实现资源的共享与互补; 四 语言基础工程建设 工作举措 明晰知识产权:通过明晰知识产权和统一规范标准,实现资源的共享与互补; 实行开发战略:及时将科研成果转化为产品占领市场,通过产品效益支撑语言工程的长期建设和科学研究的深入发展; 加快人才建设:通过学科设置和用人机制的改革,建立应用语言学人才基地,加快应用语言学人才队伍的培养。
五 科学研究 教育部语言文字信息管理司于2004年4月24-25日在北京召开了语言文字应用“十五”科研项目中期汇报交流会。 五 科学研究 语言文字应用“十五”科研立项工作引起了各界积极反响。 教育部语言文字信息管理司于2004年4月24-25日在北京召开了语言文字应用“十五”科研项目中期汇报交流会。
五 科学研究 课题研究取得阶段性成果。 部分课题已经完成,即将进行结项鉴定 。如由社科院民族所承担的“中国少数民族文字字符总集”项目、新疆民语委承担的“维、哈语人名汉字转写规范”项目等。 据不完全统计,在各种学术刊物上发表论文147篇,调查报告14篇,出版专著1部,研制软件工具5个; 一些规范标准项目已经研制完成并通过专家鉴定,如社科院语言所承担的“ISO 10646汉字国际音标收集编码”项目等。或准备以软规范形式发布,如:“汉语字母词规范原则”、 “中国少数民族文字字符总集”等。
五 科学研究 要求 在现代化的社会里,语言文字的规范标准建设要现代化,语言文字应用研究也要现代化。 地方语委要加强对本地承担科研项目的管理。 五 科学研究 要求 在现代化的社会里,语言文字的规范标准建设要现代化,语言文字应用研究也要现代化。 地方语委要加强对本地承担科研项目的管理。 课题的管理应严格按照国家语委科研办已经下发的有关规定进行。
六 民族语文信息化工作 民族语文信息化概况 我国55个少数民族中,53个民族有自己的语言(回、满两个民族通用汉语),民族地区社会通用的民族文字有28种。民族语文信息化工作主要涉及蒙古、藏、维吾尔、哈萨克、柯尔克孜、朝鲜、彝、傣等传统通用的民族语言文字。 我国民族语言文字信息化工作始于20世纪80年代,二十多年来取得了一定进展。但是,相对于汉语言文字信息化,民族语言文字的信息化工作进展缓慢。
六 民族语文信息化工作 1.民族语言文字信息化的意义 民族语言是中华民族的文化瑰宝 为西部大开发服务 边疆安全 争夺虚拟空间 西藏风光
中华民族的文化瑰宝 我国民族语言有120多种。55个少数民族中,53个民族有自己的语言(回、满两个民族通用汉语),民族地区社会通用的民族文字有28种,还有一些今天不再使用的民族古文字。 我国实行民族平等政策,每个民族都有发展自己语言文字的自由。民族要现代化,其语言文字必须首先信息化。 乌鲁木齐
为西部大开发战略服务 珠穆朗玛峰 “西部” 是包含地理位置、经济发展状况和民族分布的综合性概念。 共包括12个省、自治区、直辖市和两个自治州:内蒙古、新疆、西藏、宁夏、广西、云南、贵州、四川、甘肃、青海、陕西、重庆和湖南的湘西土家族苗族自治州、湖北的恩施土家族苗族自治州。 珠穆朗玛峰
为西部大开发战略服务 西部土地面积690多万平方公里,占全国总面积的71.9%;人口约占全国总人口的29%,其中少数民族人口超过8000万,占全国少数民族人口的80%。 西部大开发其实也就是少数民族地区的大开发。 宁夏 大理
为西部大开发战略服务 西部大开发离不开资金的投入、人才的培养和引进、与经济有关的各种管理体制和机制的改革与创新,但是在当前信息化的时代,更离不开信息的流通与开发。 语言文字是信息的主要载体,民族语言的信息化,是西部信息流通与开发的基础,是西部大开发的基础,是打造西部“后发优势”的重要举措。
边疆安全 西部发展是边疆安全、国家统一的根本性的问题 教育、新闻出版,要求民族语言的信息化 西部网络语言状况,需要民族语言尽快信息化 在跨国跨境语言的信息化上要合作且主动 利用语言信息化手段维护边疆安全
争夺虚拟空间 语言文字信息处理技术及其产品,是当今高新经济的“宠儿”。民族语言文字信息化产品具有潜在的经济价值。 虚拟世界是文化生存的新空间。民族语言信息化是民族文化占居虚拟空间的基础条件,具有重大的文化价值。 中国和平崛起走向世界,经济是后盾,文化是先行。中华民族的所有语言与文化,都是国家崛起的重要力量。
2.民族语言文字信息化状况 我国民族语文信息化工作始于20世纪80年代 有多种传统民族文字编码字符集、字型、键盘国家标准和国际标准 开发了一批应用软件,有的可在Windows系统上运行
2.民族语言文字信息化状况 蒙、藏等几种文字有了电子出版系统和办公自动化系统 蒙古、藏、朝鲜、维吾尔、彝等文种的网站或网页初步建成 蒙文、藏文等自动识别和机器辅助翻译系统有一定进展
3.语信司的民族语文工作 1998年国务院机构改革,国办发[1998]70号、国办发[1998]108号文件规定,少数民族语言文字规范标准的制定工作和信息处理工作,转归教育部管理。 2000年,国家语委进行了民族语言状况的调研。
3.语信司的民族语文工作 2002年成立民族语言文字信息管理办公室 。 2002年-2004年,同有关单位一起多次召开民族语言信息化会议。 2004年,正在组建少数民族标准化技术委员会。
3.语信司的民族语文工作 陆续下达了一批科研项目: 为建“中华大字符集”而对少数民族文字的收集整理 少数民族人名的汉字转写及罗马字母转写问题 教育领域的民族术语问题 …… 国家第二轮教育振兴计划,有民族语言信息化的专项 当前正落实至立同志批示精神,做好民族语言文字信息化工作
近期的一些工作 (一)制定、完善少数民族语言文字的规范标准。包括: (1)音、字、词、语、篇等方面的规范 (2)信息处理用的语言文字标准 民族地区对少数民族正字、正音以及对人名、地名音译转写、对术语进行规范的呼声一直很高,这些规范急待制定 目前先进行蒙、藏、维、哈、柯、朝、彝、傣等一些文种的规范标准制定工作
(二)开发民文基础软件和通用软件 开发多种民文字体的OpenType或TrueType字库 研发应用于网络计算机、平板电脑、笔式计算机等设备的多种民族语言基本操作系统和其他组件 以现有的中文平台为基础,开发符合国际化/本地化标准,支持多种民族语言文字的通用系统平台。 开发民文输入、输出工具软件
开发民文基础软件和通用软件 开发支持少数民族语言的多媒体教育平台,开发民~汉自由转换的多媒体教学与训练课件 按照《现代远程教育资源建设规范》和《网络课程开发要求》,建立支持多民族语言的多媒体远程教育系统
(三)加强民族语文资源库建设 建立语言基础工程的概念,全力进行民族语文资源库建设 语音的或文字的满足多方面需求的语料库 研发多文种的多种数据库
结束语 提倡一种文化 团结 奉献 热情 鼎新
请 思 考 语言文字工作怎样为国家和平崛起战略服务?
谢谢诸位 2004年8月19日,兰州