3 回答

TA貢獻(xiàn)1780條經(jīng)驗(yàn) 獲得超1個贊
A 字符集
是一組符號和編碼。一個 校對用于比較字符集中字符的一組規(guī)則。讓我們用一個假想字符集的例子來明確區(qū)分。
假設(shè)我們有一個有四個字母的字母表:‘a(chǎn)’,‘B’,‘a(chǎn)’,‘b’。我們給每個字母一個數(shù)字:‘a(chǎn)’=0,‘B’=1,‘a(chǎn)’=2,‘b’=3。字母‘A’是一個符號,數(shù)字0是‘A’的編碼,所有四個字母及其編碼的組合是一個字符集。
現(xiàn)在,假設(shè)我們要比較兩個字符串值,‘A’和‘B’。最簡單的方法是查看編碼:0表示‘A’,1表示‘B’。因?yàn)?小于1,所以我們說‘A’小于‘B’?,F(xiàn)在,我們所做的就是對我們的字符集應(yīng)用一個排序規(guī)則。排序規(guī)則是一組規(guī)則(在本例中只有一條規(guī)則):“比較編碼”。我們將這種最簡單的排序稱為二進(jìn)制排序。
但是如果我們想說小寫字母和大寫字母是等價的呢?然后我們至少有兩條規(guī)則:(1)把小寫字母‘a(chǎn)’和‘b’當(dāng)作相當(dāng)于‘A’和‘B’的字母;(2)然后比較編碼。我們稱之為不分案件的校對。它比二進(jìn)制排序要復(fù)雜一些。
在現(xiàn)實(shí)生活中,大多數(shù)字符集都有許多字符:不僅僅是‘A’和‘B’,而是整個字母,有時是多個字母或數(shù)千個字符的東方書寫系統(tǒng),還有許多特殊的符號和標(biāo)點(diǎn)符號。在現(xiàn)實(shí)生活中,大多數(shù)校對都有很多規(guī)則:不只是大小寫不敏感,而且重音不敏感(“重音”是一個標(biāo)記附在一個字符上,就像德語中的‘?’)和多字符映射(比如兩個德語??敝小甇E’=‘OE’的規(guī)則)。

TA貢獻(xiàn)1874條經(jīng)驗(yàn) 獲得超12個贊
添加回答
舉報