大小:10K
更新时间:24-02-03
系统:Pc
版本:v1.0
小西编码一键转换官方版是由吾爱网友推荐分享的一款绿色免费,功能实用的编码一键转换工具。它的功能非常的直接,能够将字符在汉字、GBK、UTF-8、Unicode等常见字符之间相互转换。如果我们在工作中遇到乱码的现象,或者换行失效的问题,一般都是文本编码惹的祸,不同的字符编码是不能完全兼容的,比如国内常用的是GBK、GBxxxx等编码,而国际上流行的UTF-8及UNICODE编码。通过小西编码一键转换能够解决编码问题,支持自动转换,打开即用,可以说是非常的方便实用,有需求的用户请下载使用!
1、对汉字、GBK、UTF-8、Unicode等编码的文件自动识别并按要求互相转换
2、对DOS格式、UNIX格式、MAC格式的文本自动识别并互相转换
3、对中文简繁体及台湾BIG5编码互相转换(需要指定源、目的编码格式)
4、支持文件及文件夹操作,支持鼠标拖拽
5、完全绿色软件,直接使用不需安装
1、ASCII
ASCII码是7位编码,编码范围是0x00-0x7F。ASCII字符集包括英文字母、阿拉伯数字和标点符号等字符。其中0x00-0x1F和0x7F共33个控制字符。
只支持ASCII码的系统会忽略每个字节的最高位,只认为低7位是有效位。HZ字符编码就是早期为了在只支持7位ASCII系统中传输中文而设计的编码。早期很多邮件系统也只支持ASCII编码,为了传输中文邮件必须使用BASE64或者其他编码方式。
2、GBK
GBK编码是GB2312编码的超集,向下完全兼容GB2312,同时GBK收录了Unicode基本多文种平面中的所有CJK汉字。同 GB2312一样,GBK也支持希腊字母、日文假名字母、俄语字母等字符,但不支持韩语中的表音字符(非汉字字符)。GBK还收录了GB2312不包含的 汉字部首符号、竖排标点符号等字符。
GBK的整体编码范围是为0x8140-0xFEFE,不包括低字节是0×7F的组合。高字节范围是0×81-0xFE,低字节范围是0x40-7E和0x80-0xFE。
低字节是0x40-0x7E的GBK字符有一定特殊性,因为这些字符占用了ASCII码的位置,这样会给一些系统带来麻烦。
有些系统中用0x40-0x7E中的字符(如“|”)做特殊符号,在定位这些符号时又没有判断这些符号是不是属于某个 GBK字符的低字节,这样就会造成错误判断。在支持GB2312的环境下就不存在这个问题。需要注意的是支持GBK的环境中小于0x80的某个字节未必就 是ASCII符号;另外就是最好选用小于0×40的ASCII符号做一些特殊符号,这样就可以快速定位,且不用担心是某个汉字的另一半。Big5编码中也存在相应问题。
CP936和GBK的有些许差别,绝大多数情况下可以把CP936当作GBK的别名。
3、BIG5
Big5是双字节编码,高字节编码范围是0x81-0xFE,低字节编码范围是0x40-0x7E和0xA1-0xFE。和GBK相比,少了低字节是0x80-0xA0的组合。0x8140-0xA0FE是保留区域,用于用户造字区。
Big5收录的汉字只包括繁体汉字,不包括简体汉字,一些生僻的汉字也没有收录。GBK收录的日文假名字符、俄文字符Big5也没有收录。因为Big5当中收录的字符有限,因此有很多在Big5基础上扩展的编码,如倚天中文系统。Windows系统上使用的代码页CP950也可以理解为是对Big5的扩展,在Big5的基础上增加了7个汉字和一些符号。Big5编码对应的字符集是GBK字符集的子集,也就是说Big5收录的字符是GBK收录字符的一部分,但相同字符的编码不同。
因为Big5也占用了ASCII的编码空间(低字节所使用的0x40-0x7E),所以Big5编码在一些环境下存在和GBK编码相同的问题,即低字节范围为0x40-0x7E的字符有可能会被误处理,尤其是低字节是0x5C("/")和0x7C("|")的字符。可以参考GBK一节相应说明。
尽管有些区别,大多数情况下可以把CP950当作Big5的别名。
4、UTF-8
UTF-8是UCS字符集的另一种编码方式,UTF-16的每个单元是两个字节(16位),而UTF-8的每个单元是一个字节(8位)。UTF-16中用一个或两个双字节表示一个字符,UTF-8中用一个或几个单字节表示一个字符。
可以认为UTF-8编码是根据一定规律从UCS-2转换得到的,从UCS-2到UTF-8之间有以下转换关系:
UCS-2 UTF-8
U+0000 - U+007F 0xxxxxxx
U+0080 - U+07FF 110xxxxx 10xxxxxx
U+0800 - U+FFFF 1110xxxx 10xxxxxx 10xxxxxx
例如“啊”字的UCS-2编码是0x554A,对应的二进制是0101 0101 0100 1010,转成UTF-8编码之后的二进制是1110 0101 10 010101 10 001010,对应的十六进制是0xE5958A。
UCS-4也是一种UCS字符集的编码方式,是使用4个字节的等宽编码,可以用UCS-4来表示BMP之外的辅助面字符。UCS-2中每两个字节前再加上0x0000就得到了BMP字符的UCS-4编码。从UCS-4到UTF-8也存在转换关系,根据这种转换关系,UTF-8最多可以使用六个字节来编码UCS-4。
根据UTF-8的生成规律和UCS字符集的特性,可以看到UTF-8具有的特性:
UTF-8完全和ASCII兼容,也就是说ASCII对应的字符在UTF-8中和ASCII编码完全一致。范围在0x00-0x7F之内的字符一定是ASCII字符,不可能是其他字符的一部分。GBK和Big5都存在的缺陷在UTF-8中是不存在的。
大于U+007F的UCS字符,在UTF-8编码中至少是两个字节。
UTF-8中的每个字符编码的首字节总在0x00-0xFD之间(不考虑UCS-4支持的情况,首字节在0x00-0xEF之间)。根据首字节就可以判断之后连续几个字节。
非首字节的其他字节都在0x80-0xBF之间;0xFE和0xFF在UTF-8中没有被用到。
GBK编码中的汉字字符都在UCS-2中的范围都在U+0800 - U+FFFF之间,所以每个GBK编码中的汉字字符的UTF-8编码都是3个字节。但GBK中包含的其他字符的UTF-8编码就不一定是3个字节了,如GBK中的俄文字符。
在UTF-8的编码的传输过程中即使丢掉一个字节,根据编码规律也很容易定位丢掉的位置,不会影响到其他字符。在其他双字节编码中,一旦损失一个字节,就会影响到此字节之后的所有字符。从这点可以看出UTF-8编码非常适合作为传输编码。
同类热门
类似软件
万能字符编码转换工具官方版235K158人在用 万能字符编码转换工具是一款对所有现在字符库内包含的字符进行编码转换的工具,这款软件可以将文本批量转换为unicode码,或unicode码批量转换为文本,而且也可以方便查询字符的unicode码,或查询unicode码对应的字符,非常简便。另外,万
查看Unicode字符编码转换器2.18M207人在用 Unicode字符编码转换器是一个功能强大的文本字符编码转换器,它可以帮助您将多个ANSI、UTF-8或HTML编码纯文本文档的编码转换转换为任何编码,支持交互式或批处理模式,能在几分钟内转换成千上万个文件的编码。不仅如此,它也可以将文本、php、
查看热门标签
网友评论0人参与,0条评论
最新排行
闪电word转换成pdf转换器36.3Mv6.5.0官方版 闪电word转换成pdf转换器是一款功能全面好用的pdf文件转换成word文档软件,界面简单,功能稳定,支持批量转换,操作起来 非常方便,可以快速精确的将PDF转换成Word,Excel,PPT,图片,文本,Txt,HTML,同时也可以将Word、
查看OSG格式转换器官方版7.92Mv1.1 OSG格式转换器官方版是一款能够在OSGB和OSG,IVE,OBJ格式之间互相转换的软件,这款软件支持多种格式,能够导出纹理图片、生成根文件,使用起来简单方便,而且也支持将实景三维模型osgb转换至OSG文件。另外,OSG格式转换器还支持导出为纹理
查看全能PDF转Office文档格式转换器10.34Mv5.8电脑版 全能PDF转Office文档格式转换器是一款专业的文档格式转换工具,支持一键将PDF转换到Word、Excel、PPT、RTF、 HTML、TXT。利用该工具用户能够快速的将PDF格式转换成自己需要的文件格式,以方便编辑或者打开,操作更是简单,功能
查看Wondershare PDF to Word(pdf转word转换器)563Kv4.1.0官方版Wondershare PDF to Word是Wondershare公司出品的一款专门用于PDF转换成word的转换器。相比Wondershare的其它产品而言,功能略显单一,可以说是阉割版本,所以其大小也仅6M左右,操作更加简单,没有任何其他的设置,
查看香蕉转换器(pdf转word软件)64.31Mv1.0官方版 香蕉转换器是一款功能单一但实用的pdf转word软件。它具有操作简单,易于使用,功能专精和免费的特点,支持显示转换区间和文件当前状态,能够一键将pdf文档转换为word格式文件,跟同类付费软件相比也毫不逊色。同时软件还支持ocr窗口格式,以及支持多
查看