第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

搜索列表以查看它是否包含存儲(chǔ)在 python 中不同列表中的字符串

搜索列表以查看它是否包含存儲(chǔ)在 python 中不同列表中的字符串

FFIVE 2022-10-25 15:05:55
我在一個(gè)列表(word_list)中有一個(gè)單詞列表,我創(chuàng)建了另一個(gè)列表,它只是一行文章標(biāo)題(headline_col)。標(biāo)題是多個(gè)單詞的字符串,而 word_list 是單個(gè)單詞。我想搜索標(biāo)題以查看它們是否包含我的單詞列表中的任何單詞,如果是,則在標(biāo)題中附加另一個(gè)列表(slam_list)。我已經(jīng)查過了,我看到的所有東西都只是將一個(gè)精確的字符串與另一個(gè)相同的字符串匹配。例如,查看條目是否正好是“apple”,而不是查看它是否在“john ate an apple today”中。我嘗試過使用集合,但是如果有匹配項(xiàng),我只能讓它返回 True,我不知道如何讓它附加 slam_list,甚至只是打印條目。這就是我所擁有的。我將如何使用它來獲得我需要的東西?import csvword_list = ["Slam", "Slams", "Slammed", "Slamming",             "Blast", "Blasts", "Blasting", "Blasted"]slam_list = []csv_data = []# Creating the list I need by opening a csv and getting the column I needwith open("website_headlines.csv", encoding="utf8") as csvfile:    reader = csv.reader(csvfile)    for row in reader:        data.append(row)headline_col = [headline[2] for headline in csv_data]
查看完整描述

2 回答

?
守候你守候我

TA貢獻(xiàn)1802條經(jīng)驗(yàn) 獲得超10個(gè)贊

因此,正如您所提到的,使用集合絕對(duì)是這里的方法。這是因?yàn)榧现械牟檎冶攘斜碇械牟檎乙斓枚?。如果您想知道原因,?qǐng)?jiān)?google 上快速搜索散列。進(jìn)行此更改所需要做的就是將 word_list 中的方括號(hào)更改為花括號(hào)。


您需要處理的真正問題是“標(biāo)題是多個(gè)單詞的字符串,而 word_list 是單個(gè)單詞”


您需要做的是遍歷許多單詞。我假設(shè) header_col 是標(biāo)題列表,其中標(biāo)題是包含一個(gè)或多個(gè)單詞的字符串。我們將遍歷所有標(biāo)題,然后遍歷標(biāo)題中的每個(gè)單詞。


word_list = {"Slam", "Slams", "Slammed", "Slamming", "Blast", "Blasts", "Blasting", "Blasted"}


# Iterate over each headline

for headline in headline_col:


    # Iterate over each word in headline

    # Headline.split will break the headline into a list of words (breaks on whitespace)

    for word in headline.split():


        # if we've found our word

        if word in word_list:

            # add the word to our list

            slam_list.append(headline)

            # we're done with this headline, so break from the inner for loop

            break


查看完整回答
反對(duì) 回復(fù) 2022-10-25
?
GCT1015

TA貢獻(xiàn)1827條經(jīng)驗(yàn) 獲得超4個(gè)贊

pandas在這里,由于您正在閱讀 csv,因此使用它來實(shí)現(xiàn)您的目標(biāo)可能會(huì)更容易。


你想要做的是通過它的索引來識(shí)別列,看起來它是 2。然后你找到第三列的值在word_list.


import pandas as pd


df = pd.read_csv("website_headlines.csv")

col = df.columns[2]

df.loc[df[col].isin(word_list), col]

考慮以下示例


import numpy as np

import pandas as pd


word_list = ["Slam", "Slams", "Slammed", "Slamming",

             "Blast", "Blasts", "Blasting", "Blasted"]


# add some extra characters to see if limited to exact matches

word_list_mutated = np.random.choice(word_list + [item + '_extra' for item in word_list], 10)


data = {'a': range(1, 11), 'b': range(1, 11), 'c': word_list_mutated}

df = pd.DataFrame(data)

col = df.columns[2]


>>>df.loc[df[col].isin(word_list), col]

    a   b               c

0   1   1           Slams

1   2   2           Slams

2   3   3   Blasted_extra

3   4   4          Blasts

4   5   5     Slams_extra

5   6   6  Slamming_extra

6   7   7            Slam

7   8   8     Slams_extra

8   9   9            Slam

9  10  10        Blasting


查看完整回答
反對(duì) 回復(fù) 2022-10-25
  • 2 回答
  • 0 關(guān)注
  • 147 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)