問題是在學(xué)Java的DataOutputStream/DataInputStream時(shí)想到的String?fileName?=?"dos.dat";
DataOutputStream?dos?=?new?DataOutputStream(new?FileOutputStream(fileName));
DataInputStream?dis??=?new?DataInputStream(new?FileInputStream(fileName));
?
//分別以u(píng)tf-8和utf-16be編碼的方式寫入兩個(gè)"中國"
dos.writeUTF("中國");
dos.writeChars("中國");
?
//打印readUTF()讀到的字符串
String?s?=?dis.readUTF();
System.out.println(s);文件傳輸基礎(chǔ)——Java IO流 4-4課程中,老師演示的輸出結(jié)果只打印了一個(gè)"中國"疑問:文件就是字節(jié)排列,utf-8編碼中,中文占3個(gè)字節(jié);utf-16be編碼中,中文占2個(gè)字節(jié)readUTF()方法是如何確定要讀幾個(gè)字節(jié)的呢?比如說,假若字節(jié)排列為11 22 33 44 55 66 77 88 99 0011 22 33組成utf-8的'中'44 55 66組成utf-8的'國'77 88組成utf-16be的'中'99 00組成utf-16be的"國"然而77 88 99也可組成utf-8的'不知是什么的中文'、或77組成'不知是什么的英文'那么在將字節(jié)轉(zhuǎn)為字符串的時(shí)候,read()方法是如何做到將中文對(duì)應(yīng)的字節(jié)轉(zhuǎn)為中文,而不是轉(zhuǎn)為2個(gè)字母將非utf-8編碼的字節(jié)比如utf-16be的字節(jié)排除,或停止,而不是繼續(xù)讀出來?底層代碼花了很長世間卻實(shí)在是看不懂,求大神解答感謝。
添加回答
舉報(bào)
0/150
提交
取消