计算机中的编码知识

时间:2022-09-22 15:25:25 硬件维护 我要投稿

计算机中的编码知识

  计算机是使用这些编码在计算机内部和键盘等终端之间以及计算机之间进行信息交换。为了使信息的表示、交换、存储或加工处理方便,在计算机系统中通常采用统一的编码方式,因此制定了编码的国家标准或国际标准。下面是小编帮大家整理的计算机中的编码知识,仅供参考,大家一起来看看吧。

计算机中的编码知识

  1.二-十进制编码

  在计算机中,为了适应人们的习惯,采用十进制数方式对数值进行输入和输出。这样,在计算机中就要将十进制数变换为二进制数。将十进制数变换为二进制数的方法很多,但是不管采用哪种方法的编码统称为二-十进制编码,即BCD码(Binary Coded Decimal)。在二-十进制编码中最常用的一种是8421码。它采用4位二进制编码表示1位十进制数,其中4位二进制数中由高位到低位的每一位权值分别是:23、22、21、20,即8、4、2、1。BCD码在形式上是0和1组成的二进制形式,而实际上它表示的是十进制数,只不过是每位十进制数用4位二进制编码表示,运算规则和数制都是十进制。

  2.字符编码

  英文字母和常用的数学符号与标点符号等字符通常采用ASCII(American Standard Code for Information Interchange,美国信息交换标准码)编码。

  ASCII码有7位码和8位码两种形式。7位ASCII码用7位二进制数进行编码,可以表示128个字符。8位ASCII码用8位二进制数进行编码,可以表示256个字符。

  标准ASCII 码为7位码,也叫基础ASCII码,表示所有的大写和小写字母、数字0~9、标点符号,以及在美式英语中使用的特殊控制字符共128个符号。8位ASCII码的前127个符号编码与7位码相同,后128个称为扩展ASCII码。

  计算机存储单元中,7位ASCII码常用一个字节来表示(8位二进制位),其最高位(b7)用作奇偶校验位。所谓奇偶校验是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。

  3.汉字编码

  汉字种类繁多,编码比拼音文字困难,因此在不同的场合要使用不同的编码,通常有4种类型的编码,即输入码、国标码、内码、字形码。

  (1)输入码

  输入码所解决的问题是如何使用西文标准键盘把汉字输入到计算机内。有各种不同的输入码,主要分为三类:数字编码、拼音编码和字形编形码。

  (2)国标码

  国标码又称为汉字交换码,在计算机之间交换信息用,用两个字节来表示,每个字节的最高位均为0,因此可以表示的汉字数为214=16384个。将汉字区位码的高位字节、低位字节各加十进制数32(即十六进制数的20)便得到国标码。

  (3)内码

  汉字内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。无论使用何种输入码,进入计算机后就立即被转换为机内码。规则是将国标码的高位字节、低位字节各自加上128。

  为了统一表示世界各国的.文字,1993年国际标准化组织公布了“通用多八位编码字符集”的国际标准ISO/IEC 10646,简称UCS(Universal Code Set),它为包括汉字在内的各种正在使用的文字规定了统一的编码方法。

  (4)字形码

  字形码是表示汉字字形的字模数据,因此也称为字模码,是汉字的输出形式,通常用点阵、矢量函数等表示。

  4.多媒体信息编码

  所谓多媒体信息是指由文字、声音、图像为载体的信息。图像和声音信息在计算机中也是以二进制形式编码的。

  (1)图像编码

  一幅彩色图像(image)可以看成是由许许多多个彩色的点(像素)组成的,如图1所示。每个像素点有深浅不同的颜色,这种点越小,图像越清晰。

  (2)声音编码

  声音是由声波传递的,声波编码数据在文件中的存储形式、排列顺序等称为文件格式,因各种应用需求不同,存在着多种多样的声音文件格式,有些文件格式可以存储多种不同的音频编码数据,也有些文件格式是为某一种音频编码特制的。

  拓展:C语言:ASCII编码与Unicode编码

  计算机是以二进制的形式来存储数据的,它只认识0和1两个数字,我们在屏幕上看到的文字,在存储到内存之前也都被转换成了二进制(0和1序列)。

  可想而知,特定的文字必然对应着固定的二进制,否则将无法转换。那么,怎样将文字与二进制对应呢?这就需要有一套规范,计算机公司和软件开发者都必须遵守。

  ASCII码

  我们知道,一个二进制位(Bit)有0、1两种状态,一个字节(Byte)有8个二进制位,有256种状态,每种状态对应一个符号,就是256个符号,从00000000到11111111。

  计算机诞生于美国,早期的计算机使用者大多使用英文,上世纪60年代,美国制定了一套英文字符与二进制位的对应关系,称为ASCII码,沿用至今。

  ASCII码规定了128个英文字符与二进制的对应关系,占用一个字节(实际上只占用了一个字节的后面7位,最前面1位统一规定为0)。例如,字母 a 的的ASCII码为 01100001,那么你暂时可以理解为字母 a 存储到内存之前会被转换为01100001,读取时遇到01100001 也会转换为 a。

  Unicode编码

  随着计算机的流行,使用计算机的人越来越多,不仅限于美国,整个世界都在使用,这个时候ASCII编码的问题就凸现出来了。

  ASCII编码只占用1个字节,最多只能表示256个字符,我大中华区10万汉字怎么表示,日语韩语拉丁语怎么表示?所以90年代又制定了一套新的规范,将全世界范围内的字符统一使用一种方式在计算机中表示,这就是Unicode编码(Unique Code),也称统一码、万国码。

  Unicode 是一个很大的集合,现在的规模可以容纳100多万个符号,每个符号的对应的二进制都不一样。Unicode 规定可以使用多个字节表示一个字符,例如 a 的编码为 01100001,一个字节就够了,”好“的编码为 01011001 01111101,需要两个字节。

  为了兼容ASCII,Unicode 规定前0~127个字符与ASCII是一样的,不一样的只是128~255的这一段。

【计算机中的编码知识】相关文章:

影视制作必学视频编码知识08-08

全国计算机应用基础知识:汉字、字符编码11-20

木材进口编码归类08-08

如何正确商品编码归类08-19

速录机编码设计方案08-15

php中的字符编码转换函数的用法11-16

计算机中数据的表示与存储08-18

进口商品HS编码怎么归类08-12

HS编码申报错误怎么办03-18