内部代码是指计算机汉字系统中使用的二进制字符代码
外部代码是相对于内部代码的词典。在计算机科学及相关领域中,外码是指“学习后能直接理解的外码形式
我们常说汉字的“内码”和“外码”。内码是汉字在计算机中存储、处理和传输的信息码。它必须与ascii兼容,但不能冲突。因此,gb代码的两个字节的最高位置是“1”,以区别于西文,即内部代码。汉字的输入码称为“外码”。输入代码是指我们用来输入汉字的代码。常用的外码分为数字码(如位置码)、拼音码和字体码(如五笔)。
汉字的内部代码长度为16位。因为一个汉字有两个字节,一个字节是8位,根据中国国家标准gb2312-80,一个汉字的内码长度是16位。
从内部代码到gb代码的转换是内部代码加上2020h(注意是十六进制)。从gb代码到gb代码的转换是内部代码加8080h(也是十六进制)。因为汉字是由两个字节组成的,所以国标码和内部码的区别是国标码的两个字节的最高位是0,而内部码的最高位是1,所以加了80h。