unicode和ascii的区别是什么?
ascii就是编码英文的26个字母和一些常见的符号,之后扩展了一半。总之是一个字节来做编码,大于128的部分是一些特殊符号。但ascii是无法编码别的东西的,比如说是不存在“中文的ascii码需要2个字符”这种说法的。ascii就只有一个字节。unicode是足够编码地球上所有的语言了,所以ascii中所能表示的,unicode当然全部包括了。unicode本身是只有2个字节的,之所以出现utf-8,utf-16等等之类,那是为了针对不同的应用环境,提高整体编码效率,比如如果某篇文章里绝大部分是英语(单字节就能表示),就比较适合使用utf-8,而如果绝大部分是中文(需要双字节),可能就utf-16比较合适了copy的,不过也是正确的,当然是unicode普遍.一般手机的电子书只能是uncode编码的txt
关于unicode和ascii的区别?
计算机发明后,为了在计算机中表示字符,人们制定了一种编码,叫ascii码。ascii码由一个字节中的7位(bit)表示,范围是0x00-0x7f共128个字符。后来他们突然发现,如果需要按照表格方式打印这些字符的时候,缺少了“制表符”。于是又扩展了ascii的定义,使用一个字节的全部8位(bit)来表示字符了,这就叫扩展ascii码。范围是0x00-0xff共256个字符。中国人利用连续2个扩展ascii码的扩展区域(0xa0以后)来表示一个汉字,该方法的标准叫gb-2312。后来,日文、韩文、阿拉伯文、台湾繁体(big-5)......都使用类似的方法扩展了本地字符集的定义,现在统一称为mbcs字符集(多字节字符集)。这个方法是有缺陷的,因为各个国家地区定义的字符集有交集,因此使用gb-2312的软件,就不能在big-5的环境下运行(显示乱码),反之亦然。为了把全世界人民所有的所有的文字符号都统一进行编码,于是制定了unicode标准字符集。unicode使用2个字节表示一个字符(unsignedshorint、wchar、_wchar_t、olechar)。这下终于好啦,全世界任何一个地区的软件,可以不用修改地就能在另一个地区运行了。虽然我用ie浏览日本网站,显示出我不认识的日文文字,但至少不会是乱码了。unicode的范围是0x0000-0xffff共6万多个字符,其中光汉字就占用了4万多个
字符编码中ascii,unicode和utf-8的区别?
ascii是古老的编码,那个时候还不区分字符集和编码,基本可以看作合二为一的东西。
unicode严格来说是字符集,可以有多种编码。utf-8是一种unicode的编码。兼容性最好的,我记得好像是utf-8不带bom头。注:字符集(charset)就是字符的集合,收录了一定数量的字符。每个字符有对应的id值,叫码点(codepoint)。实际存储的时候,不一定是直接存储字符串的码点(比如,为了节约空间),要进行转换。这个转换规则就是编码。unicode和ascii字符编码的区别?
ascii就是编码英文的26个字母和一些常见的符号,之后扩展了一半。总之是一个字节来做编码,大于128的部分是一些特殊符号。但ascii是无法编码别的东西的,比如说是不存在“中文的ascii码需要2个字符”这种说法的。ascii就只有一个字节。unicode是足够编码地球上所有的语言了,所以ascii中所能表示的,unicode当然全部包括了。unicode本身是只有2个字节的,之所以出现utf-8,utf-16等等之类,那是为了针对不同的应用环境,提高整体编码效率,比如如果某篇文章里绝大部分是英语(单字节就能表示),就比较适合使用utf-8,而如果绝大部分是中文(需要双字节),可能就utf-16比较合适了copy的,不过也是正确的,当然是unicode普遍.一般手机的电子书只能是uncode编码的txt
原文标题:python基础教程 Unicode和ASCII的区别是什么?,如若转载,请注明出处:https://www.saibowen.com/tougao/18372.html
免责声明:此资讯系转载自合作媒体或互联网其它网站,「赛伯温」登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考。