首頁猿問嘗試在 Python...

嘗試在 Python 中將已抓取的值列表轉(zhuǎn)換為 Pandas DataFrame。

Python

蝴蝶刀刀 2023-04-25 17:05:45

我有一個(gè)包含刮取值的列表，例如：[<a href="shropshire.html">A Shropshire Lad (David Austin Rose, Austin, 1997) </a>, <a href="agiraud.html">Abbé Giraudier (Hybrid Perpetual, Levet, 1869)</a>, <a href="abelcarr.html">Abel Carrière (Hybrid Perpetual, E. Verdier, 1875)</a>, <a href="abelc.html">Abel Carrière (Illustration from <em>Le Livre d'Or des Roses</em>, 1903)</a>, <a href="darby.html">Abraham Darby? (David Austin Rose, Austin, 1985)</a>, <a href="adammes.html">Adam Messerich (Hybrid Bourbon, Lambert, 1920)<br/> </a>,當(dāng)我將我的列表轉(zhuǎn)換為 pandas DataFrame 時(shí)，只有文本出現(xiàn)在列中，而不是完整的值。如何制作包含每個(gè)的全部?jī)?nèi)容的 df <a> ... </a>,？或者我怎樣才能得到一個(gè)有兩列的 df，一列是 href，另一列是文本？

查看完整描述

1 回答

嗶嗶one

TA貢獻(xiàn)1854條經(jīng)驗(yàn) 獲得超8個(gè)贊

在這里為其他開發(fā)人員發(fā)布答案。

您需要從標(biāo)簽中提取 href 和文本

通常像

soup = BeautifulSoup(html.text,'lxml')

with open(filename,'w',newline='',encoding='utf-8') as f:

w = csv.writer(f)

for a in soup.find_all('a',href=True):

text = a.text

link = a['href']

w.writerow([text,link])

然后你可以像這樣將這個(gè) CSV 加載到 pandas 中。

pandas.read_csv('filename.csv', columns =['text','url'])

反對(duì) 回復(fù) 2023-04-25

1 回答
0 關(guān)注
126 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

嘗試在 Python 中將已抓取的值列表轉(zhuǎn)換為 Pandas DataFrame。

嘗試在 Python 中將已抓取的值列表轉(zhuǎn)換為 Pandas DataFrame。

1 回答

添加回答

嘗試在 Python 中將已抓取的值列表轉(zhuǎn)換為 Pandas DataFrame。

嘗試在 Python 中將已抓取的值列表轉(zhuǎn)換為 Pandas DataFrame。