第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

SequenceMatcher - 更喜歡有序匹配

SequenceMatcher - 更喜歡有序匹配

慕慕森 2021-08-17 15:59:26
我有一個(gè)SequenceMatcher函數(shù)可以找到最接近的匹配項(xiàng):細(xì)繩字符串列表代碼:def seq_match(text, values, min_match=10):    highest = (None, 0)    for v in values:        sm = SequenceMatcher(a=text, b=v, autojunk=False)        ratio = int(sm.quick_ratio() * 100)        print(f'{text} : {v} : {ratio}')        if ratio > min_match and ratio > highest[1]:            highest = v, ratio    return highest我還有一個(gè)數(shù)據(jù)集:# (text, value1, value2, value3...): expected_outputtest_map = {    # 1    ('super delicious cat food', 'decent', 'delicious', 'super delicious'): 'super delicious',    # 2    ('salmon: does not contain real salmon', 'chicken', 'salmon', 'arctic salmon'): 'arctic salmon',}當(dāng)#1數(shù)據(jù)被正確匹配時(shí),#2匹配假設(shè)更長(zhǎng)的字符串a(chǎn)rtic salmon比僅僅salmon. 換句話(huà)說(shuō),我希望salmon能更好地匹配等于或更大的 mathan artic salmon。以下是全部比賽結(jié)果:# correct super delicious cat food : decent : 33super delicious cat food : delicious : 54super delicious cat food : super delicious : 76salmon: does not contain real salmon : chicken : 18salmon: does not contain real salmon : salmon : 28# incorrectsalmon: does not contain real salmon : arctic salmon : 48 # expectedsalmon: does not contain real salmon : arctic salmon : 28 or less我可以SequenceMatcher在這里強(qiáng)迫行為更理智嗎?我怎樣才能得到我想要的結(jié)果?為什么arctic還要產(chǎn)生分?jǐn)?shù)?我試過(guò)關(guān)閉自動(dòng)垃圾郵件,但它似乎沒(méi)有影響。
查看完整描述

1 回答

?
FFIVE

TA貢獻(xiàn)1797條經(jīng)驗(yàn) 獲得超6個(gè)贊

如果你看這里的文檔SequenceMatcher


您將看到其算法的以下描述:


The idea is to find the longest contiguous matching subsequence that contains   

no “junk” elements  

根據(jù)這個(gè)定義,arctic salmon獲得更高的相似度分?jǐn)?shù)是有道理的salmon。

為了更好地理解為什么看下面的代碼:


a = 'salmon: does not contain real salmon'

b = 'arctic salmon'

sm = SequenceMatcher(a, b, autojunk=False)  

sm.get_matching_blocks()

輸出:


[Match(a=1, b=0, size=1),

 Match(a=15, b=3, size=1),

 Match(a=17, b=5, size=1),

 Match(a=29, b=6, size=7),

 Match(a=36, b=13, size=0)]   

如您所見(jiàn),有 10 個(gè)匹配項(xiàng)可供arctic salmon比較,而salmon其中只有 6個(gè)匹配項(xiàng)的比率為2 * 10 / 49 = 0.40816326530612246.

有關(guān)ratio()上面鏈接中計(jì)算戰(zhàn)利品的完整說(shuō)明。


查看完整回答
反對(duì) 回復(fù) 2021-08-17
  • 1 回答
  • 0 關(guān)注
  • 327 瀏覽
慕課專(zhuān)欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢(xún)優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)