首頁(yè) 猿問(wèn) 如何使用 Python 從...

如何使用 Python 從 twitter 推文中刪除圖片 URL

Python

慕的地6264312 2022-07-12 09:43:07

我有一個(gè)來(lái)自 twitterscraper 的數(shù)據(jù)框，我正在嘗試從文本中刪除圖片 URL輸入：大家好，祝你有美好的一天。pic.twitter.com/Z1yG39NO輸出：大家好，祝你有美好的一天。df['text'] = df['text'].apply(lambda x: re.split('https:\/\/.*[\r\n]*', str(x))[0])我使用此代碼，但它只能刪除 https：謝謝：-）

查看完整描述

2 回答

慕哥6287543

TA貢獻(xiàn)1831條經(jīng)驗(yàn) 獲得超10個(gè)贊

import re

def cleaning_PicURL (text):

text = re.sub(r'pic.twitter.com/[\w]*',"", text)

return text

df['text'] = df['text'].apply(lambda x: cleaning_PicURL(x))

使用上面的代碼，它將從文本中刪除圖片 URL，這里的split函數(shù)會(huì)將文本拆分為匹配的正則表達(dá)式模式并給我們一個(gè)列表。在推文中，您可能不確定圖片 URL 的位置，因此使用sub函數(shù)而不是split函數(shù)更相關(guān)，因?yàn)閟ub函數(shù)會(huì)直接刪除帶有空字符串的匹配文本，它對(duì)您來(lái)說(shuō)很容易。正則表達(dá)式模式pic.twitter.com/[\w]*將有助于匹配文本中的所有 twitter 圖片 URL。希望這可以消除您的疑問(wèn)。

例子：

re.sub(r'pic.twitter.com/[\w]*',"", "test pic.twitter.com/va4nFjFQ5B")

'test '

反對(duì) 回復(fù) 2022-07-12

精慕HU

TA貢獻(xiàn)1845條經(jīng)驗(yàn) 獲得超8個(gè)贊

做這個(gè) ：

df['text'] = df['text'].str.replace(r'pic.twitter.com(.*?)\s(.*)', '')

(.*?)\s(.*) 把這個(gè)放在每個(gè)帖子特定的 URL 的其余部分

反對(duì) 回復(fù) 2022-07-12

2 回答
0 關(guān)注
103 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書(shū)簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢(xún)優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

如何使用 Python 從 twitter 推文中刪除圖片 URL

如何使用 Python 從 twitter 推文中刪除圖片 URL

2 回答

做這個(gè) ：

添加回答