第七章 现代汉字研究 引子:现代汉字研究的内容 第一节 现代汉字的字量 第二节 现代汉字的字形 第三节 现代汉字的字序

Slides:



Advertisements
Similar presentations
质数和合数 富县北教场小学 潘小娟 1 、什么叫因数? 2 、自然数分几类? 奇数和偶数. 3 、自然数还有一种新的分类方法, 就是按一个数的因数个数来分. 4 、写出 1—20 的因数。 前置性作业.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
0/40 符号( symbol )编码  1 字符编码  2 汉字编码  3 其他编码. 1/40 一、字符编码- ASCII 码 American Standard Code Information Interchange ,美国标准信息交换码; 由美国国家标准化协会 ANSI( American.
第二章 汉字录入方法介绍  2.1 汉字录入简介 汉字录入的现状  在 20 世纪 70 年代中期我国开始系统地研究和开发汉字信息处理技 术。 80 年代初期产生了 CCDDS 系统,得到了广泛的应用。  在汉字操作系统发展的同时产生了五百余种的汉字输入方法设计 方案,其中几十种有实用价值的方案得到推广,现在已经成为汉.
第一节 汉字概说 第二节 现代汉字的形体 第三节 现代汉字的结构 第四节 汉字的整理和标准化 第五节 使用规范汉字
第九章 金融资本 第一节 借贷资本和利息 第二节 货币需求与供给 第三节 股份资本 第四节 保险业资本 第五节 金融衍生产品.
第三章 文 字.
《解析几何》 乐山师范学院 0 引言 §1 二次曲线与直线的相关位置.
药物分析 pharmaceutical analysis
一、现代汉字的组成 二、现代汉字的字频统计 三、现代汉语常用字 四、现代汉语通用字 五、现代汉语专业用字
Windows 98 启动与退出 启动: 退出: 关闭系统 开机 自检 设置用户口令 出现windows 桌面
汉字规范与 规范汉字表的研制
计算机发展早期主要用于科学计算,现在计算机在日常生活的应用主要是处理非数值信息,那计算机如何表示以及处理非数值信息的?
网页设计师的职业成长规律 主讲:刘万辉 淮安信息职业技术学院.
证券投资技术分析.
机械教研组教学课件 欢迎莅临指导 授课人:王小政 江苏省海安县双楼中等专业学校.
Module 7 planes, boats and trains
第三章、汉字 本章要点: 第一节、汉字概说 第二节、汉字的造字法 第三节、汉字的形体 第四节、汉字标准化.
模块3 汉字 单元 二 汉字字形 主讲人:漆明珠.
从外部结构研究说,汉字从小到大有三个层次,就是笔画、部件和整字。下面我们就来研究这三个层次。
第二章 文字 一、教学重点 汉字的产生、汉字的特点、汉字形体的演变、造字法 二、教学难点 使用规范汉字汉字概说
文字及其处理技术.
《现代汉语》重点课程 第二章 汉字 第二节 字形结构.
UI(用户界面)集训班 Illustrator 高级班.
内容提要: 汉字与计算机键盘匹配存在的问题 汉字键盘输入发展简史 汉字编码输入方案 汉字输入法的软件实现 汉字编码的类型
1、环境中直接影响生物生活的各种因素叫做 。它可以分为 和 两类 。
第一节 汉字的性质 第二节 汉字的特点及其与汉语的关系 作业1
第三篇 组织工作.
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
直线和圆的位置关系.
第 三 章 汉 字 2017/9/12.
全国计算机等级考试 二级基础知识 第二章 程序设计基础.
在PHP和MYSQL中实现完美的中文显示
计算机基础知识 丁家营镇九年制学校 徐中先.
第一节 旅游规划的意义和种类 第二节 旅游规划的内容 第三节 旅游规划的编制 第四节 旅游景区规划
管理信息结构SMI.
第十章 IDL访问数据库 10.1 数据库与数据库访问 1、数据库 数据库中数据的组织由低到高分为四级:字段、记录、表、数据库四种。
数据挖掘工具性能比较.
小学语文总复习.
整合思维导图的初中英语教学设计 主讲人:卢璐.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第一章 函数与极限.
本节内容 字符编码 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群 : 联系电话:
C语言程序设计 主讲教师:陆幼利.
学习目标 1、什么是字符集 2、字符集四个级别 3、如何选择字符集.
2.3.4 平面与平面垂直的性质.
第四章 四边形性质探索 第五节 梯形(第二课时)
<编程达人入门课程> 本节内容 内存的使用 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群: ,
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第4章 Excel电子表格制作软件 4.4 函数(一).
长春理工大学 电工电子实验教学中心 数字电路实验 数字电路实验室.
3.16 枚举算法及其程序实现 ——数组的作用.
第八章 总线技术 8.1 概述 8.2 局部总线 8.3 系统总线 8.4 通信总线.
Topic 1 Welcome to China! Section A.
上杭二中 曾庆华 上杭二中 曾庆华 上杭二中 曾庆华.
静定结构位移计算 ——应用 主讲教师:戴萍.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
中國語文基礎知識手冊 字形間架結構.
第六章 Excel的应用 五、EXCEL的数据库功能 1、Excel的数据库及其结构 2、Excel下的数据排序 (1)Excel的字段名行
数据表示 第 2 讲.
第三章汉字编码原理.
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
微机原理与接口技术 西安邮电大学计算机学院 董 梁.
第十七讲 密码执行(1).
入侵检测技术 大连理工大学软件学院 毕玲.
一元一次方程的解法(-).
学习目标 1、什么是列类型 2、列类型之数值类型.
Presentation transcript:

第七章 现代汉字研究 引子:现代汉字研究的内容 第一节 现代汉字的字量 第二节 现代汉字的字形 第三节 现代汉字的字序 第四节 现代汉字的构字法 第五节 汉字与信息处理 作业7

引子:现代汉字研究的内容 现代汉字学应该包括以下内容 第一,汉字的性质和特点。 第二,现代汉字的属性。现代汉字属性指的是现代汉字所负载的各种信息,包括字量、字形、字音、字序等方面。 第三,现代汉字的应用。 这包括两个界面:人际界面和人机界面。

第一节 现代汉字的字量 一、现代汉字的总字数 二、通用字和常用字 1、《现代汉字表》的研制 ——是规范字表,只收规范字。总字量约10000。 2、现代汉字的来源: 传统汉字占75% ;新造字占2.7%;借用字占1.3%;简化字占20%。 二、通用字和常用字 1、通用字、常用字、罕用字 2、选取通用字和常用字的标准 A、字的频度;B、字的使用度;C、字的构词能力和构字能力。 3、通用字的字量:大约接近7000字。 4、常用字的字量:大约3000多字,其中最常用字2000多字。 5、《现代汉语通用字表》——1988年发布,收字7000个。 6、《现代汉语常用字表》——1988年发布,收常用字3500个,其中一级常用字2500个,二级次常用字1000个。

三、专门用字:以社会某个特定的群体用字为对象。 1、扫盲用字表——2000字(其中必学字1800,参考字200个) 2、小学用字表——《小学语文用字表》3071个 3、汉语水平•汉字等级表——收汉字2905个 四、专业用字 一般用字——人们在非专业行为的交际中所用的字。 专业用字——一般字以外的字。可分九类。 (1)带有文言色彩的字。(2)带有方言色彩的字。(3)姓名用字。(4)史地用字。(5)动植物名称用字。(6)科技用字。 (7)宗教用字。(8)民族用字。(9)译音用字。 五、限制和减少汉字的字数

第二节 现代汉字的字形 字形分析分为溯源分析和现状分析。 溯源分析——以这个字在产生时候的字形为对象所做的分析。(造字法) 现状分析——以这个字当前楷书规范字形为对象所做的分析。 现状分析可分为外部结构分析和内部结构分析。 外部结构分析——纯粹的字形外观结构分析,分析组合成份和组合方式。(构形法) 内部结构分析——研究字形和字音、字义的关系,说明构字理据。(构字法)

一、笔画 1、笔画:指构成汉字的线条,是汉字构形的最小单位。 2、笔画数:最少的是1画,最多的是64画。 3、拥字量:在一个确定的汉字字符集中,每种笔画有多少个汉字,叫做该笔画的拥字量。 笔画太少,不易区别,笔画太多,不便应用。 拥字量最多的是9—12画。 4、笔形:指笔画的形状。 汉字笔形有5种——横、竖、撇、点、折。 折笔笔形规范。 各种笔形的使用规律。 各种笔形的使用频率。 5、笔画的组合: 有三种类型:相离、相接、相交。 6、笔顺:指书写汉字时下笔先后的顺序。 汉字笔顺规范。 

二、部件 1、部件:也叫字根、字元、字素,是由笔画组成的具有组配汉字功能的构字单位。||部件小于整字,大于笔画。 2、部件拆分:只根据字形,不考虑字形和字义。(字形拆分原则讨论) 分平面拆分和层次拆分。 平面拆分——一次拆分出基础部件。 层次拆分——逐层拆分,最后得到基础部件。(层次拆分的规则) 3、部件的分类: 成字部件(如“口”)和非成字部件(如“宀扌氵” )、 基础部件(最小的不能再拆分的部件,如“日、刂” )和合成部件(如“早、立” )、 通用部件(参加两个以上不同字形的构字的部件,如“亻、刂” )和特殊部件(只在一种字形结构中出现的部件(孤立部件),如“脊”字头)

二、部件 4、汉字部件规范: 1997年发布。20902个汉字经拆分后得到560个基础部件。 5、部件名称和部位名称 部件名称:成字部件按该字读音,多音字按常读音,非成字部件按习惯名称。 部位名称:上头下底,左旁右边,内心外框、中腰四角。 6、部件的变形:同一个部件出现在字的不同部位而引起的形体变化。 改变部分笔形;拉长或压扁。 7、部件的整理: 整理汉字部件,使它简明、规范,具有通用性,对汉字的规范化、简便化有重要意义。

三、整字 1、独体字与合体字: 由一个部件构成的字是独体字,由几个部件构成的字是合体字。 2、独体字的数量: 195—372个。 3、合体字的部件: 两个部件和三个部件构成的合成字最多。 4、部件组合的规律: 基础部件组合模式:比较复杂。 第一级部件组合模式:分4大类13小类:左右、上下、包围、框架。 1、左右结构:(1)左右(形把),(2)左中右(街班); 2、上下结构:(3)上下(要是),(4)上中下(曼爱); 3、包围结构:(5)全包围(国固), (6)上三包围(问同), (7)左三包围(匡匣), (8)下三包围(凶幽), (9)上左包围(压病), (10)上右包围(句可), (11)下左包围(这延), (12)下右包围(斗头) 4、框架结构: (13)框架(承乖)。

第三节 现代汉字的字序 一、查字法的标准化 1)部首法 2)笔画法 3)四角法 4)音序法:就是汉语拼音字母序列法。 可以分为: 1、单纯字母序列法 2.音节•汉字•字母分层序列法 二、汉字编码的研究(见后面内容)

第四节 现代汉字的构字法 一、字符和字符的分类 1、字符: 汉字的内部结构,即指与字音、字义有联系的汉字构成成份的组合。 构字拆分和构形拆分。构字拆分的结果是字符,构形拆分的结果是部件。 2、字符的类别 根据字符和整字意义的关系,可分为三类:意符、音符、记号。 意符——和整字在意义上有联系的字符。如“刂(割刻)、扌(打按)、艹(草蒿)”。 音符——和整字在读音上有联系的字符。如“皇(隍蝗惶)、巴(爸吧疤)”。 记号——和整字在意义和读音上都没有联系的字符。如“丁(灯厅打)、×(赵杀)”。

第四节 现代汉字的构字法 二、现代汉字的新六书 (1)会意字,由两个或两个以上的意符构成,如“从、析”。 (2)形声字,由形符和意符构成,如“疤、病”。 (3)半意符半记号字,由意符和记号构成,如“布、缸”。 (4)半音符半记号字,由音符和记号构成,如“球、笨”。 (5)独体记号字,由一个记号构成,如“日、月”。 (6)合体记号字,由两个或两个以上的记号构成,如“马、燕”。 三、现代汉字的理据性 1、文字的理据性:文字符号和语言成份建立的联系有道理可说。 2、现代汉字的构字理据: 汉字的理据性是指意符、音符和字义字音有联系。 3、理据度及其计算 现代汉字的理据度大约在50%。 4、汉字的溯源分析

第五节 汉字与信息处理 一、汉字信息处理的过程 通常汉字信息处理的过程分为三个阶段: 汉字信息的输入 汉字信息的处理 汉字信息的输出 二、汉字编码及其评价

三、理想的汉字编码方案及计算机汉字输入系统应满足的指标 (1)规范性: 音码编码方案符合《汉语拼音方案》;形码编码方案符合汉字结构规律和语言文字规范; 音码和形码方案均应遵循《信息交换用汉字编码字符集》的有关规定。 (2)易学性: a编码规则简单、明确,部件与键位分布科学、合理,易学易记; b拆分规则和编码规则符合汉字认知过程; c学后不易忘记,间断使用时易于恢复; d规则的二义性小、码表与编码规则的符合程度高; e字量升级时,编码方法与规则不变。 (3)快速性:分为两类: 编码方案指标评价: a静态字、词平均码长;b静态字、词重码率;c静态键位分布系数等;d不等长编码技术。 软件系统指标评价:a高频先见技术;b字、词混合输入(无需键位切换)技术;c重码自动区分、词组自动编码等智能技术。 (4)兼容性:与国际通用键盘兼容;与多种显示终端兼容;与通用系统兼容; (5)一致性:编码规则应前后一致,贯彻始终,不能自相矛盾,同类结构的汉字应使用相同的编码规则,尽量避免随意性。 (6)完备性: 信息处理用汉字集通常分三个层次:基本集(含国标一、二级汉字共6763个),IS0一IEC大字符集(包括基本集和辅助集,共20902个汉字)和全汉字集(包括全部汉字约60000个左右)

作业 1、现代汉字研究练习题。(见课外补充材料)(名词解释和简述题,包括部分汉字规范化、汉字教学的内容。) 2、汉字编码方案应该满足怎样的指标体系?