第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

檢查并刪除 NoneTypes 的 Jaro 字符串相似性

檢查并刪除 NoneTypes 的 Jaro 字符串相似性

函數(shù)式編程 2023-12-12 21:43:37
我試圖辨別兩個(gè)字符串之間的字符串相似性(使用 Jaro)。每個(gè)字符串都位于我的數(shù)據(jù)框中的單獨(dú)列中。String 1 = df['name_one'] String 2 = df['name_two']當(dāng)我嘗試運(yùn)行字符串相似性邏輯時(shí):from pyjarowinkler import distancedf['distance'] = df.apply(lambda d: distance.get_jaro_distance(str(d['name_one']),str(d['name_two']),winkler=True,scaling=0.1), axis=1)我收到以下錯(cuò)誤: **error: JaroDistanceException: Cannot calculate distance from NoneType (str, str)**太好了,所以列中沒有類型,所以我做的第一件事就是檢查這一點(diǎn):maskone = df['name_one'] == Nonedf[maskone]masktwo = df['name_two'] == Nonedf[masktwo]這不會(huì)產(chǎn)生 None 類型......此時(shí)我正在撓頭,但繼續(xù)以任何方式清理這兩列。df['name_one'] = df['name_one'].fillna('').astype(str)df['name_two'] = df['name_two'].fillna('').astype(str) 然而,我仍然得到:error: JaroDistanceException: Cannot calculate distance from NoneType (str, str)我是否正確刪除了 NoneTypes?
查看完整描述

1 回答

?
互換的青春

TA貢獻(xiàn)1797條經(jīng)驗(yàn) 獲得超6個(gè)贊

問題

問題并不完全是您只遇到NoneTypes字符串,它也可能引發(fā)此異常,正如您在實(shí)現(xiàn)中看到的那樣distance.get_jaro_distance

if not first or not second:

    raise JaroDistanceException("Cannot calculate distance from NoneType ({0}, {1})".format(

        first.__class__.__name__,

        second.__class__.__name__))

選項(xiàng)1

嘗試用“NA”替換您的無類型和/或空字符串或從數(shù)據(jù)集中過濾它們。


選項(xiàng)2

對(duì)可能引發(fā)此異常的行使用標(biāo)志值/距離。在下面的例子中,我將利用999


from pyjarowinkler import distance


df['distance'] = df.apply(lambda d: 999 if not str(d['name_one']) or not str(d['name_two']) else distance.get_jaro_distance(str(d['name_one']),str(d['name_two']),winkler=True,scaling=0.1), axis=1)



查看完整回答
反對(duì) 回復(fù) 2023-12-12
  • 1 回答
  • 0 關(guān)注
  • 160 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)