JAVA自带转码方式的学习

2018-06-07 本文已影响0人 caomengsi

最近工作中遇到一个问题，由于海外系统环境默认采用UTF-8格式编码，以支持多语言环境。而国内系统由于只需要支持中英文，故默认采用GBK编码格式。因此当把海外环境生成的交易报告单发送给国内的报表系统时，报表系统显示为乱码，无法正常阅读。

基于此，我百度了下相关资料。发现JAVA自带一种转码工具nativenative2ascii,可以实现码制间的转换。它是sun java sdk提供的一个工具，用来将别的文本类文件（比如*.txt,*.ini,*.properties,*.java等等）编码转为Unicode编码。为什么要进行转码，原因在于程序的国际化。Unicode编码的定义：Unicode（统一码、万国码、单一码）是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。

其用法如下：

native2ascii [-reverse] [-encoding 编码] [inputfile [outputfile]]

说明：

-reverse：将Unicode编码转为本地或者指定编码，不指定编码情况下，将转为本地编码。

-encoding encoding_name：转换为指定编码，encoding_name为编码名称。

inputfile：表示输入文件全名。

outputfile：输出文件名。如果缺少此参数，将输出到控制台。

实践

A：将zh.txt转换为GBK编码，输出文件到i.txt

native2ascii -encoding GBK zh.txt i.txt

B：将i.txt转换为GBK编码，输出到i_gbk.txt

native2ascii -reverse -encoding GBK i.txt i_gbk.txt

native2ascii -reverse命令中-encoding指定的编码为源文件的编码格式。而在native2ascii 命令中-encoding指定的编码为（生成的）目标文件的编码格式。

总结

native2ascii是一个非常好的转码工具，并且转码是可逆的！而其真正的含义并非本地编码——>转码为ASCII码，而是一个通用的文本文件编码转换工具。在做编码转换的时候有两类指定编码的情形，分别指输出文件编码和输入文件编码。

JAVA自带转码方式的学习

猜你喜欢

热点阅读