3 回答

TA貢獻1966條經(jīng)驗 獲得超4個贊
SOUNDEX是一個不錯的算法,但是在該主題上已有最新進展。創(chuàng)建了另一個算法,稱為Metaphone,后來將其修訂為Double Metaphone算法。我已經(jīng)親自使用了雙元音的java apache commons實現(xiàn),它是可定制的和準確的。
他們在Wikipedia頁面上也有許多其他語言的實現(xiàn)。已經(jīng)回答了這個問題,但是如果您發(fā)現(xiàn)應(yīng)用程序中出現(xiàn)了SOUNDEX的任何已確定的問題,很高興知道有選項。有時,它可以為兩個完全不同的單詞生成相同的代碼。創(chuàng)建了雙重對講機來幫助解決該問題。
維基百科被盜:http://en.wikipedia.org/wiki/Soundex
為了應(yīng)對Soundex算法的不足,勞倫斯·飛利浦(Lawrence Philips)為此目的開發(fā)了Metaphone算法。飛利浦后來開發(fā)了對Metaphone的改進,他將其稱為Double-Metaphone。Double-Metaphone包含比其前任更大的編碼規(guī)則集,可處理非拉丁字符的子集,并返回主要和次要編碼,以說明單個單詞在英語中的不同發(fā)音。
在雙變音位頁面的底部,他們具有針對各種編程語言的實現(xiàn):http : //en.wikipedia.org/wiki/Double-Metaphone
Python和MySQL實施:https://github.com/AtomBoy/double-metaphone
添加回答
舉報