Download presentation
Presentation is loading. Please wait.
Published byFarida Susanto Modified 5年之前
1
本节内容 字符编码 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群 : 联系电话:
2
1、原始的ASCII编码: 昆山爱达人信息技术有限公司 www.bcdaren.com QQ:1250121864
ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。
3
2、ASCII编码的拓展:GB2312或GB2312-80 昆山爱达人信息技术有限公司 www.bcdaren.com
QQ: 2、ASCII编码的拓展:GB2312或GB 1、ASCII 2、ASCII编码的弊端是什么?
4
这是一个编码方案,说白了就是一张包含全世界所有文字的一个编码表,只要这个世界上存在的文字符号,统统给你一个唯一的编码:
昆山爱达人信息技术有限公司 QQ: 3、UNICODE编码 <1> 什么是UNICODE? 这是一个编码方案,说白了就是一张包含全世界所有文字的一个编码表,只要这个世界上存在的文字符号,统统给你一个唯一的编码: Unicode编码范围是:0-0x10FFFF,可以容纳100多万个符号! <2> UNICODE的问题: Unicode只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。
5
4、如何存储UNICODE:UTF-16 / UTF-8 是Unicode的实现方式
昆山爱达人信息技术有限公司 QQ: 4、如何存储UNICODE:UTF-16 / UTF-8 是Unicode的实现方式 <1> UTF-16: UTF-16编码以16位无符号整数为单位,注意是16位为一个单位,不 表示一个字符就只有16位。这个要看字符的unicode编码处于什么范围而定,有可能 是2个字节,也可能是4个字节现在机器上的unicode编码一般指的就是UTF-16。 <2> UTF-8: Unicode编码(16进制) ║ UTF-8 字节流(二进制) F ║ 0xxxxxxx FF ║ 110xxxxx 10xxxxxx FFFF ║ 1110xxxx 10xxxxxx 10xxxxxx FFFF ║ 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx <3> BOM(Byte Order Mark): UTF-8 ║ EF BB BF UTF-16LE ║ FF FE UTF-16BE ║ FE FF
6
5、如何判断文本文件的存储格式? BOM(Byte Order Mark): UTF-8 ║ EF BB BF
昆山爱达人信息技术有限公司 QQ: 5、如何判断文本文件的存储格式? BOM(Byte Order Mark): UTF-8 ║ EF BB BF UTF-16LE ║ FF FE UTF-16BE ║ FE FF
7
昆山爱达人信息技术有限公司 QQ: 课后练习: <线上班>学员可见
Similar presentations