第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如果文本包含在另一個數(shù)據(jù)幀中,則使用二進制名稱標(biāo)記行

如果文本包含在另一個數(shù)據(jù)幀中,則使用二進制名稱標(biāo)記行

翻閱古今 2022-09-06 21:23:25
我正在研究采礦調(diào)查數(shù)據(jù)。我能夠標(biāo)記某些關(guān)鍵字的行:survey['Rude'] = survey['Comment Text'].str.contains('rude', na=False, regex=True).astype(int)現(xiàn)在,我想標(biāo)記任何包含名稱的行。我有另一個包含常見美國名稱的數(shù)據(jù)幀。以下是我認(rèn)為可以工作的內(nèi)容,但它沒有標(biāo)記任何行,并且我已經(jīng)驗證了名稱確實存在于“注釋文本”中for row in survey:       for word in survey['Comment Text']:        survey['Name'] = 0        if word in names['Name']:            survey['Name'] = 1
查看完整描述

1 回答

?
慕慕森

TA貢獻1856條經(jīng)驗 獲得超17個贊

您沒有正確循環(huán)遍歷序列。 遍歷 中的列名。 遍歷注釋字符串。 創(chuàng)建包含所有 .for row in survey:surveyfor word in survey['Comment Text']:survey['Name'] = 00s

您可以使用 set intersections 和 apply()來避免所有通過行的循環(huán):

    survey = pd.DataFrame({'Comment_Text':['Hi rcriii',

                                           'Hi yourself stranger',

                                           'say hi to Justin for me']})

    names = pd.DataFrame({'Name':['rcriii', 'Justin', 'Susan', 'murgatroyd']})

    s2 = set(names['Name'])


    def is_there_a_name(s):

        s1 = set(s.split())

        if len(s1.intersection(s2))>0:

            return 1

        else:

            return 0


    survey['Name'] = survey['Comment_Text'].apply(is_there_a_name)


    print(names)

    print(survey)


         Name

0      rcriii

1      Justin

2       Susan

3  murgatroyd

              Comment_Text  Name

0                Hi rcriii     1

1     Hi yourself stranger     0

2  say hi to Justin for me     1

作為獎勵,返回以獲取每行的匹配次數(shù)。len(s1.intersection(s2))


查看完整回答
反對 回復(fù) 2022-09-06
  • 1 回答
  • 0 關(guān)注
  • 98 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號