為了使A與Z匹配,我們將使用正則表達(dá)式:[A-Za-z]如何允許正則表達(dá)式匹配用戶輸入的utf8字符?例如環(huán)保部等中文單詞
3 回答
GCT1015
TA貢獻(xiàn)1827條經(jīng)驗 獲得超4個贊
Java正則表達(dá)式API適用于該char類型
該char類型隱式為UTF-16
如果您有UTF-8數(shù)據(jù),則需要在輸入時將其轉(zhuǎn)碼為UTF-16
Unicode是通用的字符集,而UTF-8可以描述所有字符(包括控制字符,標(biāo)點符號,符號,字母等)。您將必須更加明確地確定要包含的內(nèi)容和要排除的內(nèi)容。Java正則表達(dá)式使用\p{category}語法按類別匹配代碼點。請參閱Unicode標(biāo)準(zhǔn)的列表類別。
如果要在表意文字序列中識別和分隔單詞,則需要查看更復(fù)雜的API。我將從BreakIterator類型開始。
添加回答
舉報
0/150
提交
取消
