我正在嘗試研究 fuzzywuzzy 如何計算這個簡單的模糊比率:print(fuzz.ratio("66155347", "12026599"))
25為什么模糊率不為 0,因為它們在每個位置都是完全不同的字符?編輯距離 = 8(因為每個值都需要被替換) a 為 8(字符串 1 的長度為 8) b 為 8(字符串 2 的長度為 8)fuzz.ratio 為 (a+b - 編輯距離)/(a+b)模糊比率為 (8+8 - 8)/(8+8) = .50模糊比率為 50我的數(shù)學(xué)也一定有問題;我快50了模糊率是如何達(dá)到 25 的?任何指導(dǎo)將不勝感激。
1 回答

素胚勾勒不出你
TA貢獻(xiàn)1827條經(jīng)驗 獲得超9個贊
fuzzywuzzy 庫使用 Levenshtein 距離的加權(quán)版本,為替換賦予權(quán)重 2,從而使 Levenshtein 距離達(dá)到 12。則 (8 + 8 - 12) / (8 + 8) = 0.25。
添加回答
舉報
0/150
提交
取消