首頁猿問如果文本包含在另一個(gè)數(shù)據(jù)幀中，則使...

如果文本包含在另一個(gè)數(shù)據(jù)幀中，則使用二進(jìn)制名稱標(biāo)記行

Python

翻閱古今 2022-09-06 21:23:25

我正在研究采礦調(diào)查數(shù)據(jù)。我能夠標(biāo)記某些關(guān)鍵字的行：survey['Rude'] = survey['Comment Text'].str.contains('rude', na=False, regex=True).astype(int)現(xiàn)在，我想標(biāo)記任何包含名稱的行。我有另一個(gè)包含常見美國名稱的數(shù)據(jù)幀。以下是我認(rèn)為可以工作的內(nèi)容，但它沒有標(biāo)記任何行，并且我已經(jīng)驗(yàn)證了名稱確實(shí)存在于“注釋文本”中for row in survey: for word in survey['Comment Text']: survey['Name'] = 0 if word in names['Name']: survey['Name'] = 1

查看完整描述

1 回答

慕慕森

TA貢獻(xiàn)1856條經(jīng)驗(yàn) 獲得超17個(gè)贊

您沒有正確循環(huán)遍歷序列。遍歷中的列名。遍歷注釋字符串。創(chuàng)建包含所有 .for row in survey:surveyfor word in survey['Comment Text']:survey['Name'] = 00s

您可以使用 set intersections 和 apply（）來避免所有通過行的循環(huán)：

survey = pd.DataFrame({'Comment_Text':['Hi rcriii',

'Hi yourself stranger',

'say hi to Justin for me']})

names = pd.DataFrame({'Name':['rcriii', 'Justin', 'Susan', 'murgatroyd']})

s2 = set(names['Name'])

def is_there_a_name(s):

s1 = set(s.split())

if len(s1.intersection(s2))>0:

return 1

else:

return 0

survey['Name'] = survey['Comment_Text'].apply(is_there_a_name)

print(names)

print(survey)

Name

0 rcriii

1 Justin

2 Susan

3 murgatroyd

Comment_Text Name

0 Hi rcriii 1

1 Hi yourself stranger 0

2 say hi to Justin for me 1

作為獎(jiǎng)勵(lì)，返回以獲取每行的匹配次數(shù)。len(s1.intersection(s2))

反對(duì) 回復(fù) 2022-09-06

1 回答
0 關(guān)注
109 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

如果文本包含在另一個(gè)數(shù)據(jù)幀中，則使用二進(jìn)制名稱標(biāo)記行

如果文本包含在另一個(gè)數(shù)據(jù)幀中，則使用二進(jìn)制名稱標(biāo)記行

1 回答

添加回答

如果文本包含在另一個(gè)數(shù)據(jù)幀中，則使用二進(jìn)制名稱標(biāo)記行

如果文本包含在另一個(gè)數(shù)據(jù)幀中，則使用二進(jìn)制名稱標(biāo)記行