0%

字符集和字符编码

每个人都有一个本能的侵犯能量储存器,在储存器里,侵犯能量的总量是固定的,它总是要通过某种方式表现出来,从而是个人内部的侵犯性驱力减弱。 —— 弗洛伊德

一、字符

  1. 定义

        字符(Character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等,如:1、2、3、A、B、C、~!·#¥%……—*()——+等。

二、字符集

  1. 定义

        字符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,就需要进行字符编码,以便计算机能够识别和存储各种文字。中文文字数目大,而且还分为简体中文和繁体中文两种不同书写规则的文字,而计算机最初是按英语单字节字符设计的,因此,对中文字符进行编码,是中文信息交流的技术基础。

  1. 分类
    • ASCII
    • ISO8859-1
    • GB码字符集
    • GB2312字符集
    • GB12345-90字符集
    • GBK字符集
    • BIG5字符集
    • GB18030字符集
    • 通用字符集(UCS)字符集
    • Unicode字符集

三、字符编码

  1. 定义

        字符编码(Character encoding)也称字集码,是把字符集中的字符编码为指定集合中某一对象(例如:比特模式、自然数序列、8位组或者电脉冲),以便文本在计算机中存储和通过通信网络的传递。它是一套法则,使用该法则能够对自然语言的字符集合(如字母表或音节表)与另一个集合(如号码或电脉冲)进行配对,即在符号集合与数字系统之间建立对应关系。它是信息处理的一项基本技术,通常人们用符号集合(如文字)来表达信息,而以计算机为基础的信息处理系统则是利用元件(硬件)不同状态的组合来存储和处理信息的,元件不同状态的组合能代表数字系统的数字,因此字符编码就是将符号转换为计算机可以接受的数字系统的数(称为数字代码)。常见的例子包括将拉丁字母表编码成摩斯电码和ASCII。