Presentation is loading. Please wait.

Presentation is loading. Please wait.

第二章 汉字录入方法介绍  2.1 汉字录入简介 2.1.1 汉字录入的现状  在 20 世纪 70 年代中期我国开始系统地研究和开发汉字信息处理技 术。 80 年代初期产生了 CCDDS 系统,得到了广泛的应用。  在汉字操作系统发展的同时产生了五百余种的汉字输入方法设计 方案,其中几十种有实用价值的方案得到推广,现在已经成为汉.

Similar presentations


Presentation on theme: "第二章 汉字录入方法介绍  2.1 汉字录入简介 2.1.1 汉字录入的现状  在 20 世纪 70 年代中期我国开始系统地研究和开发汉字信息处理技 术。 80 年代初期产生了 CCDDS 系统,得到了广泛的应用。  在汉字操作系统发展的同时产生了五百余种的汉字输入方法设计 方案,其中几十种有实用价值的方案得到推广,现在已经成为汉."— Presentation transcript:

1 第二章 汉字录入方法介绍  2.1 汉字录入简介 2.1.1 汉字录入的现状  在 20 世纪 70 年代中期我国开始系统地研究和开发汉字信息处理技 术。 80 年代初期产生了 CCDDS 系统,得到了广泛的应用。  在汉字操作系统发展的同时产生了五百余种的汉字输入方法设计 方案,其中几十种有实用价值的方案得到推广,现在已经成为汉 字输入方法的主流。  与此同时,随着计算机技术的飞速发展, 汉字文字识别、汉字语音 处理、汉语计算机辅助教学等领域的研究也取得了许多可喜的成 果。 2.1.2 语音录入与 OCR 识别  键盘输入法需要使用者经过一段时间的练习才可能达到基本要求 的速度,对于并不是专业电脑使用者来说,多少会有些困难。同 时随着计算机的运算速度不断提高,另外几种新的录入方法出现 了。这些输入法统称为非键盘输入法,主要有手写录入、语音录 入与 OCR 识别( Optical Character Recognition 光学字符识别) 录入。这些方法共同的特点就是使用简单,但都需要特殊设备。

2 第二章 汉字录入方法介绍  2.2 键盘汉字录入方法分类 2.2.1 概述 汉字键盘输入方法主要有两类:  整字输入。它使用特殊的输入设备,目前已经很少有人使用这种 方法了。  汉字编码输入。它是根据汉字的字形、字音或其他特点经过一定 规则的分析后,组成代码,在代码与汉字的属性之间建立一种确 定的关系。它是目前计算机汉字输入的主要方法。 2.2.2 汉字录入的编码方法 按照汉字的属性分类,汉字编码方案有四类。  音码:是利用汉字的拼音输入的方法。  形码:是以汉字的字形结构(笔画、部首)为编码原则,将汉字 拆分成笔画、部首、字根等零件作为码元的编码方案。  音形结合码或形音结合码  非音非形码

3 第二章 汉字录入方法介绍  2.3 区位法汉字录入 2.3.1 分区与划位  计算机汉字处理中最常用的是《中华人民共和国国家标准 GB2312-80 信息交换用汉字编码字符集 —— 基本集》。基本集中 每个符号用两个字节表示,对 7445 个图形字符作了编码。 其中汉字 6763 个,字体为简化字,分成两级。一级汉字 3755 个, 按汉语拼音的字母顺序排列,同音字以笔形顺序排列,一级汉字 约占近代文献汉字累计使用频度 99 . 9 %左右;二级汉字 3008 个, 按部首排列,部首次序及同部首字按笔画数排列。  基本集可以被看成是一个 94×94 格的表格,表中每一行叫做一个 “ 区 ” ,每一列叫做一个 “ 位 ” ,区和位的编号都是从 1 到 94 。表中 1 区至 3 区是各种专用的符号, 3 区中间开始到 8 区,顺序是英文、 日文、希腊文、俄文和汉语拼音等各种文字的字母,第 9 区是制 表用的符号。 10 至 15 区目前是空白,留待进一步补充新字符使用。 一级汉字排列在第 16 区至第 55 区;二级汉字排列在第 56 区至第 87 区,自 88 区开始,直到最后都是空白。

4 第二章 汉字录入方法介绍 2.3.2 区位输入法  Windows XP 内置的内码输入法支持区位码的输入。  区位码是四位输入码:前二位是区码,后二位是位码。区的编码 是从 01 ~ 94 ,位的编码也是从 01—94 。在区位码输入方式下, 键入相应的区码和位码就可以输入一个汉字。  在使用区位输入法时也可以使用查询键。查询键为 “?” 键或空格键。 当输入两位合法的区码后,输入 “?” 键或空格键,系统会在重码选 择区显示以这两位字符开始编码的汉字或符号序列。在查询方式 下完成输入后,可用 “Backspace” 键和 “Esc” 键退出查询状态。  例如用户通过用鼠标左键点击输入法状态条上的标识符来实现区 位码的汉字输入。如 “ 啊 ” 字,输入 “1601” 即可,或键入 “16” ,再按 空格键,在候选窗口中再选择 “1” 即可。

5 第二章 汉字录入方法介绍  2.4 智能 ABC 汉字输入法 智能 ABC 输入法是 Windows XP 中自带的一种汉字输入法。 2.4.1 基本输入方式 1. 全拼输入  全拼输入方式就是使用汉语拼音进行汉字输入。其规则是按规范 的汉语拼音输入,输入过程和书写汉语拼音的过程完全一致。在 输入时可以按词输入,词与词之间用空格或者标点隔开。如果不 会输词,可以一直写下去,到了系统允许键入的最多字符个数时, 系统将响铃警告。 2. 简拼输入  其规则是取每个汉字音节的第一个字母。对于 zh 、 ch 、 sh( 知、 吃、诗 ) 的音节,也可以取前两个字母组成,以减少重码,提高输 入速度。 3. 混拼输入  混拼输入是汉语拼音开放式、全方位的输入方式。其规则是两个 以上的词语,在输入时有的音节全拼,有的音节简拼,可以混合 一起输入。

6 第二章 汉字录入方法介绍 4. 笔形输入  在智能 ABC 系统中汉字 “ 形 ” 的元素,按照基本的笔画形状,共分 为八类;取码时按照笔顺,最多取 6 笔;含有笔形 “ 十 (7)” 和 “ 口 (8)” 的结构,按笔形代码 7 或 8 取码,而不将它们分割成简单笔形代码。 5. 音形混合输入  音形混合输入方式是输入汉字的拼音与笔形描述来确定一个汉字。 其规则为: ( 拼音 +[ 笔形描述 ])+( 拼音 +[ 笔形描述 ])+……+( 拼音 +[ 笔形描述 ]) 。其中, “ 拼音 ” 可以是全拼、简拼或混拼。对于多音 节词的输入, “ 拼音 ” 一项是不可少的; “[ 笔形描述 ]” 项可有可无, 最多不超过 2 笔。对于单音节词或字,允许纯笔形输入。 6. 双打输入  一个汉字在双打方式下,只需要击键两次:奇次为声母,偶次为 韵母。而有些汉字只有韵母,称为零声母音节,这时奇次键入 “o” 字母 (o 被定义为零声母 ) ,偶次为韵母。虽然击键为两次,但是在 屏幕上显示的仍然是一个汉字规范的拼音。

7 第二章 汉字录入方法介绍 2.4.2 汉字输入基本过程  激活汉字输入法  开始输入 第一键只允许 26 个英文字母,大写、小写均可以。若第一键为 i,I,u,v 时具有特殊的含义。  输入中间阶段 各种字符包括数字,均可作为输入字串的组成部分,但对于规范 变换,输入字串应符合组合规则。  输入结束键 拼音输入完毕后可以按空格键、标点符号键或回车键等。 空格键或标点符号键:表示将以词为单位转换输入字串。 回车键:表示将以字为单位转换输入信息。 “[” 、 “]” 、 “Ctrl+ -” 为特殊情况结束键。  结果修正阶段 系统对输入的音形字串在分析、变换后,把结果显示在相应输入 信息的位置,计算机用响铃提醒操作人员对转换结果进行正确性 判断。

8 第二章 汉字录入方法介绍 2.4.3 智能特色与设置 1. 属性设置  在智能 ABC 状态窗内按鼠标右键,将弹出一个设置选单。在选单 中选择 “ 属性设置 ” 项,则弹出属性设置对话框。 2 .外码窗的编辑  智能 ABC 的外码窗允许输入字串可长达 40 个字符,能输入很长的 词语,甚至短句。在输入过程中,可以使用光标移动键进行插入、 删除、取消等操作。 3. 输入过程中的特殊键定义 4. 自动分词和构词  依照语法规则,把一次输入的拼音字串,划分成若干个简单语段, 分别转换成汉字词语的过程,称为自动分词;把这若干个词和词 素组合成一个新的词条的过程,称为构词。 5. 自动记忆  自动记忆通常用来记忆词库中没有的新词,如人名、地名等。它 的特点是自动进行,或者略加人为干预。

9 第二章 汉字录入方法介绍 6. 强制记忆  一般用来定义那些非标准的汉语拼音词语和特殊符号。利用该功 能,可以直接把新词加到用户库中。 7. 朦胧回忆  对于刚刚用过不久的词条,可以使用最简单的办法依据不完整的 信息进行回忆,这个过程称为朦胧回忆。朦胧回忆的功能通过 Ctrl+“-” 键完成。 8. 频度调整和记忆  词的频度是指一个词使用的频繁程度。选中属性设置中的 “ 词频调 整 ” 选项后,词频调整就开始自动进行,不需要人为干预。 9. 前加成分和后加成分  系统自动处理构词过程中的前加成分和后加成分。 10. 词库系统  智能 ABC 具有一个约六万词条的基本词库。同时还有一个具有自 动筛选功能的动态词库,其自动记忆的词汇容量可达 17000 词条; 强制记忆的词汇可达 400 条。

10 第二章 汉字录入方法介绍 2.4.4 使用技巧  双打键盘及跟随提示。在 “ 双打 ” 方式下,可以使用双打键盘进行 输入,按状态窗上的软键盘按钮,即可弹出双打键盘。  “i” 、 “I”—— 中文数量词简化输入。智能 ABC 提供阿拉伯数字和中 文大小写数字的转换能力,常用量词也可简化输入。 “i” 为输入小 写中文数字的前导字符。 “I” 为输入大写中文数字的前导字符。  “[” 、 “]”—— 以词定字。对一个双音节或多音节的词,用以词定字 键确定其中的单字,可以减少单字输入中的重码。方法就是用 “[” 取第一个字, “]” 取最后一个字。  u —— 强制记忆词条的输入。事先用强制记忆功能定义了词条, 输入时应当以 “u” 字母打头。  v —— 图形符号输入。输入 GB-2312 字符集 1 ~ 9 区各种符号,在 标准状态下,按字母 v+ 数字 (1 ~ 9) ,即可获得该区的符号。  v —— 中文输入过程中的英文输入。在 “ 标准 ” 或 “ 双打 ” 方式下输入 英文,键入 “v” ,后面跟随要输入的英文,按空格键即可。  中文标点的输入。中文标点符号的输入在各个输入法中是一致的。

11 第二章 汉字录入方法介绍 2.4.5 提高指南  了解词库内容  把握按词输入的大体规律  选择符合自己特点的打法  2.5 形码输入法  形码输入法主要是通过汉字的字形结构对汉字进行编码,基本上 都是把汉字拆分成一个个笔画、部首、字根等,由于作为拆分的 码元不同,所以产生了多种不同的编码方案。其中普及最广的是 五笔字型汉字输入方法。


Download ppt "第二章 汉字录入方法介绍  2.1 汉字录入简介 2.1.1 汉字录入的现状  在 20 世纪 70 年代中期我国开始系统地研究和开发汉字信息处理技 术。 80 年代初期产生了 CCDDS 系统,得到了广泛的应用。  在汉字操作系统发展的同时产生了五百余种的汉字输入方法设计 方案,其中几十种有实用价值的方案得到推广,现在已经成为汉."

Similar presentations


Ads by Google