当前位置:首页 » 六六互联 » 正文

西文和中文字符,由于形式不同采用不同的编码

263 人参与  2022年07月06日 14:40  分类 : 六六互联  评论

西文和中文字符,由于形式不同采用不同的编码

字符包括西文字符和中文字符。在计算机系统中,对非数值的文字和其他符号是以数值方式处理的,即用二进制编码表示文字和符号。对西文和中文字符,由于形式不同采用不同的编码。

1.西文字符

目前计算机中普遍采用的西文字符编码是ASCIIAmerican Standard Code for Information Interchange,美国信息交换标准代码)字符编码。ASCII码用于在不同计算机硬件和软件系统中实现数据传输标准化,在大多数的小型机和微型计算机都使用此码。ASCII码有7位和8位码两种版本,国际通用的ASCII码是7位,即使用7二进制数表示一个字符的编码,共有27=128个不同的字符,如表1.2所示。

西文和中文字符,由于形式不同采用不同的编码 

2.汉字字符

ASCII码只对英文字母、数字、标点符号进行了编码,汉字也需要被编码才能存入计算机。这些编码主要包括汉字输入码、内码、字形码、地址码和信息交换码等。

1)输入码。汉字输入码是人们通过键盘输入汉字时所输入的内容,也称为外码。根据输入法的不同,一个汉字的输入码也不同,如“中”字的全拼输入码是“zhong”,五笔输入码是“kh”。

2)国标码。我国于1980年颁布国家汉字编码标准GB 23121980《信息交换用汉字编码字符集—基本集》,简称GB码或国标码。国标码的字符集中收录了6763常用汉字和682个非汉字字符,其中,一级汉字3755个,按照汉语拼音进行排列;二级汉字3008个,按照偏旁部首进行排列。

3)机内码。汉字的机内码是计算机系统内部对汉字进行存储、处理、传输的汉字代码,也称为汉字内码。目前对于国标码,一个汉字的内码用两个字节存储,并把每个字节的二进制最高位1作为汉字内码的标识,以免与单字节的ASCII码混淆。如果用十六进制来表示,就是把汉字国标码的每个字节加上80H1000 00002,所以两个字节的汉字国标码和内码存在以下关系:

汉字的内码 = 汉字的国标码 +8080H

西文和中文字符,由于形式不同采用不同的编码

4)字形码。字形码是存放汉字字形信息的编码,通过字形码将汉字在计算机屏幕上显示出来或通过打印机打印出来,分为点阵字形和矢量表示方式两种,字形码和内码一一对应。

5)地址码。汉字地址码是每个汉字字形码在汉字字库中的相对位移地址,需要向输出设备输出汉字时必须通过地址码才能在汉字字库中找到所需要的字形码,在输出设备上形成可见的汉字字形。


来源:服务器,转载请保留出处和链接!

本文链接:http://www.cau168.com/post/127.html

抗投诉服务器
西文  中文  字符  形式  采用  编码  

六六互联长期出售外贸服务器

<< 上一篇 下一篇 >>

六六互联

服务器 | 主机

Copyright 六六互联.Some Rights Reserved.www.ic.vip