第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機(jī)立即綁定

Java讀取流數(shù)據(jù)遇到BOM首字符時的處理

標(biāo)簽:
Java

项目中通过 InputStream 读取文本文件数据时经常会遇到读入的字符流中含有特殊首字符的情况。这个标识在 Java 读取文件的时候,不会被去掉,而且 String.trim() 也无法删除,导致读入的数据比预期的长度大1,此时的特殊首字符有可能就是系统保存文本文件时添加的 BOM 标识。

BOM 字符是什么?

BOM 即 Byte Order Mark,是 Unicode 规范中推荐的标记字节顺序的方法。比如说对于 UTF-16,如果接收者收到的 BOM 是 \uFEFF,表明这个字节流是 Big-Endian 的;如果收到 \uFFFE,就表明这个字节流是Little-Endian的。在 UTF-8 中不需要 BOM 来表明字节顺序,但可以用其来表明 UTF-8 的编码规则。BOM的 UTF-8 编码是 EF BB BF(用 UltraEdit 打开文本并切换到16进制可以看到)。所以如果接收者收到以 EF BB BF 开头的字节流,就知道这是 UTF-8 编码了。

在 Windows 下用文本编辑器创建的文本文件,如果选择以 UTF-8 等 Unicode 格式保存,会默认在文件头(第一个字符)都会加入一个不可见的 BOM 标识。

BOM 字符的影响

在读入数据时,由于 BOM 字符不会被忽略掉,而且 String.trim() 也无法删除,会导致我们判断首字符时出现不必要的麻烦,例如当我们需要判断读入字符串以某个字符开头时 BOM 字符就可能造成判断失败,需要针对 Unicode 格式保存的文件做特殊处理。

如何简单的统一处理 BOM 字符

可以使用 Apache Commons IO 中的 BOMInputStream 去封装下原始的 InputStream 即可获得一个过滤了 BOM 字符的输入流,然后再继续后续的操作即可。

點擊查看更多內(nèi)容
1人點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優(yōu)質(zhì)文章

正在加載中
產(chǎn)品經(jīng)理
手記
粉絲
1
獲贊與收藏
29

關(guān)注作者,訂閱最新文章

閱讀免費(fèi)教程

感謝您的支持,我會繼續(xù)努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進(jìn)行掃碼打賞哦
今天注冊有機(jī)會得

100積分直接送

付費(fèi)專欄免費(fèi)學(xué)

大額優(yōu)惠券免費(fèi)領(lǐng)

立即參與 放棄機(jī)會
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

舉報

0/150
提交
取消