慕碼人8056858
2019-02-20 02:54:10
直接上代碼,方便同學(xué)可以復(fù)制下來(lái)跑跑
try {
String str = "上海上海";
String gb2312 = new String(str.getBytes("utf-8"), "gb2312");
String utf8 = new String(gb2312.getBytes("gb2312"), "utf-8");
System.out.println(str.equals(utf8));
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
結(jié)果打印false
jdk7和8下面都是這結(jié)果,ide編碼是utf-8
跪請(qǐng)大神賜教?。。。?!
2 回答

www說
TA貢獻(xiàn)1775條經(jīng)驗(yàn) 獲得超8個(gè)贊
Java 所有的 String 都是 Unicode 編碼的,使用 String.getBytes(...) 獲得的就是對(duì)于編碼的字節(jié)數(shù)組,你這段代碼效果是把 UTF8 編碼的字節(jié)數(shù)組直接讀成 GB2312 的,當(dāng)然是不對(duì)的。
String 本身就是統(tǒng)一的編碼了,如果需要輸出特定編碼的字符串,直接使用 String.getBytes(...) 就能獲得對(duì)應(yīng)編碼的字符串字節(jié)數(shù)組,不存在轉(zhuǎn)換這個(gè)概念。
如果是把 UTF8 形式的字符串字節(jié)數(shù)組,轉(zhuǎn)成 GB2312 形式的,代碼應(yīng)該是
byte[] bytes = ...
String str = new String(bytes, "UTF-8");
bytes = str.getBytes("GB2312");

暮色呼如
TA貢獻(xiàn)1853條經(jīng)驗(yàn) 獲得超9個(gè)贊
字符串gb2312和utf8都已經(jīng)是亂碼了,new String(str.getBytes("utf-8"), "gb2312")意思是使用utf-8來(lái)編碼,再使用gb2312來(lái)解碼,肯定亂碼
添加回答
舉報(bào)
0/150
提交
取消