5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用 5.4 数字视频及应用

Slides:



Advertisements
Similar presentations
国家税务总局关于修改企业所得税年度纳税申报表( A 类, 2014 年版) 部分申报表的公告(国家税务总局公告 2016 年第 3 号) 一、对《企业基础信息表》( A )及填报说明修改如下: (一) “107 从事国家非限制和禁止行业 ” 修改为 “107 从事国家限制或禁止行业 ”
Advertisements

汇编语言 程序设计 第 1 章 基础知识 第 1 章 基础知识 ◆ 汇编语言程序设计概述 ◆ 进位计数制及其相互转换 ◆ 计算机中数的表示 ◆ 计算机中字符的表示 汇编语言程序设计概述 进位计数制及其相互转换 计算机中数的表示 计算机中字符的表示.
1 1.2 信息的表示与存储  数据:数据是对客观事物的符号表示。 如,数值、文字、语言、图形、图像等都是不同形 式的数据。  信息:信息是既是对客观事物变化和特征的反映,又 是事物之间相互作用、相互联系的表征。 信息必须数字化编码,才能用计算机进行传送、存 储和处理。 信息具有针对性和时效性。
2014 年 12 月 企业所得税年度纳税申报表 (A 类, 2014 版 ) 辅导材料(二) A 企业基础信息 A 主表.
简历,工作的钥匙 北大青鸟 *** 中心. 找工作流程 准备简历投发简历 笔试 面试 复试转正试用 发展.
《推荐表》、《协议书》 注册、打印操作说明 2012 年 9 月. 目录 1. 基本流程 2. 时间安排 3. 学生注册 4. 数据准备 5. 审核生成 6. 下载打印 7. 协议录入 8. 常见问题.
景观水池渗漏的研究 年级专业:12级土木工程 指导教师: ××× 教 学 点: ××××教学点 新疆工程学院继续教育学院 20 年 月 日
第4章 文字处理与编辑排版.
2015退伍士兵焊工专业 第一学期 课程名称:计算机基础(一).
陳尚朋 (Louis Chan) 萬方數據(香港)有限公司 2005年2月
文崗資訊股份有限公司 Apex Information Services Co., Ltd.
文崗資訊股份有限公司 Apex Information Services Co., Ltd.
黄岛区政府部门责任清单编制工作介绍 二〇一五年六月.
大学计算机基础 山东大学计算机学院 张鹏 高等学校计算机公共教学改革与实践 大学计算机基础 山东大学计算机学院 张鹏
工程定额与计价方法 教材名称:工程建设定额原理与实务
建设工程施工管理 模拟卷 一、单项选择题 1.下列选项中,除( )以外都属于施工机械使用费。 A.购置费 B.安拆费及场外运费 C.折旧费 D.修理费.
阳光工程引导性培训 宁夏自治区盐池县农广校
《毛泽东思想和中国特色社会主义体系概论》 第一章马克思主义中国化两大理论成果
博碩士論文繳交講習會 2013年.
汉字编码 汉字编码.
課程名稱:計算機概論 授課老師:李春雄 博士

Unicode和多语言信息处理 adoal.
市八中学 胡亮平 办公室:F504 高中信息科技 市八中学 胡亮平 办公室:F504
中国的富饶之地 —东北.
珍珠容顏 光采煥發.
2.3 信息表示与编码 所谓编码,就是利用数字串来标识所处理对象的不同个体。
第三章、自動檢查 編著者:蔡永銘.
第二章 數字系統:電腦內部的資料表示法 在第一章中,我們對於電腦有了初步的認識,在深入介紹電腦的各項組成元件之前,首先我們必須先了解另一種不同於人類使用習慣的二進位表示法,由於電腦的半導體、磁性、光學元件適合用來表示二進位,因此二進位表示法非常適合用來設計電腦。
第二章 计算机基础知识 2.1 计算机系统的组成与工作原理 2.2 数制转换及运算 2.3 数据在计算机中的表示.
中國文化大學 九十七年大專程度 義務役預備軍官預備士官 官科及入營梯次志願選填作業說明會
數字系統與資料表示法 電腦的基本單位 數字系統 數值資料表示法 數值資料與算數運算 數碼系統 浮點數表示法 文字表示法 資料來源:周裕達教授.
第一章 计算机基础知识 计算机的基本概念 计算机系统的组成 信息的编码 微型计算机的硬件组成.
中文輸入 拼音輸入法 拆字輸入法 綜合拼音與拆字輸入法 中文手寫輸入法 掃描、中文圖形輸入: 語音輸入法: 微軟新注音、自然輸入法
資料表示法與數字系統 主講:顧叔財 資料來源: 計算機概論.
A3-1 數字系統 A3-2 資料表示法 A3-3 資料的儲存
计算机文化基础 第一章 计算机的基础知识.
精進教師研習 QR Code製作教學 資料來源:
目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明. 目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明.
目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明. 目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明.
目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明. 目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明.
目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明. 目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明.
目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明. 目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明.
電子學位論文上傳系統 -- 提交說明會 華藝數位股份有限公司 2008/05.
6-1 資料表示法簡介 6-2 數值表示法 6-3 數字系統介紹 6-4 數字系統轉換方式
计算机组成原理 The Principle of Computer
IT&SAMS小組 (IIT - 倉頡輸入法)
全国图书馆联合编目系统异构系统上载 发言人:索晶 2013年12月13日.
HKMO(港澳博硕)优秀学术全文资源库 HKMO优秀学术全文资源库是港澳地区受港府资助著名院校博硕论文,其在科研、学术价值方面代表了港澳地区高校的最高学术成就。反映了港澳名校不同学科在不同阶段发展的历史轨迹。也反映了港澳地区政治、经济、文化、教育、科技等领域的发展成就。是了解和研究港澳学术和科研必不可少的学术资源。
博碩士論文上傳說明會 105年5月24日 NTHU Library Reader Services Division.
目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明. 目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明.
企業採購 標售公告專區 操作講解 台塑網電子商務網站
武汉理工大学人事系统 职称评审资格审查培训
目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明. 目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明.
目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明. 目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明.
目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明. 目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明.
教育部技專校院共用性電子資料庫購置計劃 廠商:漢珍數位圖書公司
第 1 章 文字媒體 多媒體導論與應用-第三版 1.1 文字的格式 1.2 數位化文字的應用 1.3 課後練習
目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明. 目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明.
目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明. 目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明.
2.1 文字的不同屬性 2.2 文字的版面設計 2.3 不同的文字檔案格式 2.4 按需要設定合適的文字屬性 2.5 文字檔案格式的轉換.
第7章、文字媒體製作.
目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明. 目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明.
文崗資訊股份有限公司 Apex Information Services Co., Ltd.
第四章 图元的属性.
設計圖法實習I 第一章 工程圖概述 1-1 工程圖之重要性 1-2 工程圖之種類 1-3 工程圖之規範 1-4 圖紙之規格.
目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明. 目錄 教學注意事項 教學元件類型 瀏覽課程之基本配備 操作使用說明.
101年預備軍官、士官考選官科及入營梯次選填作業說明
文崗資訊股份有限公司 Apex Information Services Co., Ltd.
第二章 计算机中的信息表示.
Presentation transcript:

5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用 5.4 数字视频及应用 第5章 数字媒体及应用 5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用 5.4 数字视频及应用

5.1 文本与文本处理 5.1.1 字符的编码 5.1.2 文本准备 5.1.3 文本的分类与表示 5.1.4 文本编辑、排版与处理* 5.1 文本与文本处理 5.1.1 字符的编码 5.1.2 文本准备 5.1.3 文本的分类与表示 5.1.4 文本编辑、排版与处理* 5.1.5 文本的展现

5.1.1 字符编码

西文字符的编码——ASCII码 西文字符由拉丁字母、数字、标点符号以及一些特殊符号所组成 ASCII码是西文字符在计算机中的常用编码方案 美国标准信息交换码(American Standard Code for Information Interchange, 简称ASCII码): ASCII字符集包含96个可打印字符和32个控制字符 采用7个二进位进行编码 计算机中使用1个字节存储1个ASCII 字符

标准ASCII字符集及其码表 0 1 2 3 4 5 6 7 8 9 A B C D E F 1 2 3 4 5 6 7 1 0 0 b6 b5 b4 b3 b2 b1 b0 1 0 0 1 1 0 0 1 1 0 1 0 1 1 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 8 9 A B C D E F b6b5b4 b3b2b1b0

汉字如何编码? 汉字的特点 如何编码? 数量大;多个国家和地区使用;字形复杂,同音字多 确定收入多少字、哪些字? 汉字在字符集中的应怎样排序? 确定使用的代码结构和代码空间

常用的汉字编码字符集 国家标准GB2312 汉字扩充规范 GBK 国家标准GB18030 台湾地区的标准汉字字符集CNS 11643 (BIG 5,俗称“大五码”) 日本工业标准汉字字符集JIS X 0208-90 韩国国家标准汉字字符集KSC 5601-87

GB2312汉字编码字符集 1980年颁布《信息交换用汉字编码字符集·基本集》——GB2312-1980 GB2312字符集由三个部分构成: 一级汉字 (3755个) 二级汉字 (3008个) (扩充使用) 字母、数字和各种符号 ……………… 1 94 2 3 位号 …… …… 9 16 55 56 87 区 号 (按汉语拼音排列) (按偏旁部首排列) 共6763个汉字和682个符号,每个汉字或符号都有一个确定位置,该位置的区号和位号就是这个汉字的“区位码” 拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个 (注:区位码仅用于在键盘上输入汉字)

GB2312汉字的编码 GB2312汉字的机内码 每一个GB2312汉字使用16位(2个字节)表示 每个字节的最高位均为“1” 输入码 字形码

汉字区位码——机内码转换 例子 本1730 学4907 (1)区位码先转换成十六进制数表示 (2)(区位码的十六进制表示)+A0A0H=机内码 ; 例子 本1730 学4907

几种汉字编码的对比 GB 18030 编码保持向下兼容 27484汉字 GB2312 GBK UCS-2 (Unicode) 编码 不兼容! 00 FF 00 FF 21003汉字 6763汉字 GB2312 27484汉字 GB18030 标准名称 GB2312 GBK GB 18030 UCS-2 (Unicode) 字符集 6763个汉字(简体字) 21003个汉字(包括GB2312汉字在内) 27 000多汉字(包括GBK汉字和CJK及其扩充中的汉字) 包含10万字符,其中的汉字与GB18030相同 编码方法 双字节存储和表示,每个字节的最高位均为“1” 双字节存储和表示,第1个字节的最高位必为“1” 部分双字节、部分4字节表示 UTF-8单字节可变长编码 UTF-16双字节可变长编码 兼容性 编码 不兼容! 编码保持向下兼容

5.1.2 文本准备 ——文稿如何输入计算机

文字符号输入计算机的方法 (1)数字编码, 如电报码、区位码等, (2)字音编码, 如智能ABC等 字符信息的输入 人工输入 自动识别输入 键盘输入 (1)数字编码, 如电报码、区位码等, (2)字音编码, 如智能ABC等 (3)字形编码,如五笔字形和表形码等, (4)形音编码 发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法

文字符号输入计算机的方法 优点: 不足: 自然,流畅 小型化,适合移动计算 识别速度和正确性还需提高 书写要求还要降低 字符信息的输入 键盘输入 联机手写输入 自动识别输入 字符信息的输入 人工输入 优点: 自然,流畅 小型化,适合移动计算 不足: 识别速度和正确性还需提高 书写要求还要降低

文字符号输入计算机的方法 优点: 自然,方便,适合移动计算 不足: 对说话人、说话方式、说话内容的适应能力要大大增强 键盘输入 联机手写输入 语音输入 自动识别输入 字符信息的输入 人工输入 优点: 自然,方便,适合移动计算 不足: 对说话人、说话方式、说话内容的适应能力要大大增强 识别速度和正确性还需大大提高

文字符号输入计算机的方法 数字文本 纸介质文本 文本的映象 扫描仪 OCR (image) 识别率已达到98% 功能: 简、繁体字混合识别 中文、西文混合识别 文字、表格混合识别 智能校对功能 印刷体识别 键盘输入 联机手写输入 语音输入 自动识别输入 字符信息的输入 人工输入 扫描仪 OCR 数字文本 纸介质文本 文本的映象 (image)

文字符号输入计算机的方法 技术上非常困难,还无法实用 目前准备先突破工整的楷书手写体的识别! 印刷体识别 手写体识别 键盘输入 联机手写输入 语音输入 自动识别输入 字符信息的输入 人工输入 技术上非常困难,还无法实用 目前准备先突破工整的楷书手写体的识别!

5.1.3 文本的分类与表示

简单文本(纯文本 ) 没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是 .txt 由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息 举例: 本 书 由 南 京 大 学 出 B1 BE CA E9 D3 C9 C4 CF BE A9 B4 F3 D1 A7 B3 F6 版 社 ( P u b l i s h i n g B0 E6 C9 E7 28 50 75 62 6C 69 73 68 69 6E 67 H o u s e o f N a n j i n 20 48 6F 75 73 65 20 6F 66 20 4E 61 6E 6A 69 6E g U n i v e r s i t y ) 出 版 67 20 55 6E 69 76 65 72 73 69 74 79 29 B3 F6 B0 E6 文本的内容 文本在计算机中的表示

丰富格式文本 有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本”

超文本 若干文本或文本中的各个部分可按照其内容的关系互相链接起来,从而形成 “超文本” A B C D E F G H a1 a2 b2 文本块可以是一个网页,一个文档,一段文字,也可以是一张图片,甚至一段声音或视频 超链是有向的,起点位置称为链源,它可以是文本块中的一个标题、一句句子、一个关键词、一幅画、一个图标等 “超链”实际上就是一个指针,用于指向其他文本块,也可以指向同一文本块中的其他部分

5.1.5 文本的展现(输出)

文本的展现(输出) 使用的软件:文本阅读器/文本浏览器 文本展现的过程: 嵌入在文本编辑(处理)软件中,如微软的Word, 独立的软件:如Adobe公司的Acrobat Reader,微软公司的IE等 文本展现的过程: 对文本的格式描述进行解释 生成文字和图表的映像(bitmap) 传送到显示器或打印机输出

字形的描述 2种不同的字形描述方法: 轮廓点 点阵描述 轮廓描述 直线 二次曲线