如何計(jì)算給定2個字符串的距離相似性度量?我需要計(jì)算2個字符串之間的相似度。那究竟是什么意思呢?讓我用一個例子來解釋一下:真實(shí)的一句話: hospital誤區(qū): haspita現(xiàn)在我的目標(biāo)是確定修改錯誤單詞以獲得真實(shí)單詞所需的字符數(shù)。在這個例子中,我需要修改2個字母。那么百分比是多少?我總是把真正的詞長度。因此它變?yōu)?/8 = 25%所以這兩個給定的字符串DSM是75%。如何以性能為關(guān)鍵考慮因素來實(shí)現(xiàn)這一目標(biāo)?
3 回答

明月笑刀無情
TA貢獻(xiàn)1828條經(jīng)驗(yàn) 獲得超4個贊
可以使用大量的字符串相似性距離算法。這里列出的一些(但沒有詳盡列出):
Needleman Wunch
史密斯沃特曼
Smith Waterman Gotoh
Jaro,Jaro Winkler
骰子相似度
Monge Elkan
包含所有這些實(shí)現(xiàn)的庫稱為SimMetrics ,它同時具有java和c#實(shí)現(xiàn)。
- 3 回答
- 0 關(guān)注
- 715 瀏覽
添加回答
舉報(bào)
0/150
提交
取消