首頁猿問提取 src 屬性

提取 src 屬性

Python

慕田峪7331174 2023-02-07 14:55:36

我想做的事：這個 HTML 代碼：<img class="poster lazyload lazyloaded" data-src="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg" data-srcset="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 1x, https://image.tmdb.org/t/p/w188_and_h282_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 2x" alt="Hitman" src="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg" srcset="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 1x, https://image.tmdb.org/t/p/w188_and_h282_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 2x" data-loaded="true">我想提取“data-src”或“src”（或包含圖像 URL 的每個屬性）屬性值。我試過的：Posters = soup.find("img")["src"]print(Posters)但這顯然會返回每個 img 標簽的所有值，因此每個鏈接都與海報無關(guān)。輸出：https://www.themoviedb.org/assets/2/v4/logos/v2/blue_short-8e7b30f73a4020692ccca9c88bafe5dcb6f8a62a4c6bc55cd9ba82bb2cd95f6c.SVGhttps://www.themoviedb.org/assets/2/v4/logos/v2/blue_short-8e7b30f73a4020692ccca9c88bafe5dcb6f8a62a4c6bc55cd9ba82bb2cd95f6c.SVG對于海報，我指的是（檢查此 URL https://www.themoviedb.org/search?&query=Hitman：）電影海報。概括我想在類“.lazyloaded”中提取屬性內(nèi)的值我希望一切都清楚。謝謝。

查看完整描述

1 回答

飲歌長嘯

TA貢獻1951條經(jīng)驗獲得超3個贊

您可以嘗試過濾class：

posters = soup.find_all("img", {"class": "lazyloaded"})

for poster in posters:

print(poster["src"])

請參閱文檔：https ://www.crummy.com/software/BeautifulSoup/bs4/doc/#searching-by-css-class

編輯：更多解釋

假設(shè)您有以下文件demo.html：

<!DOCTYPE html>

<html>

<head>

<title>Title</title>

</head>

<body>

<img class="poster lazyload lazyloaded"

data-src="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg"

data-srcset="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 1x, https://image.tmdb.org/t/p/w188_and_h282_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 2x"

alt="Hitman"

src="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg"

srcset="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 1x, https://image.tmdb.org/t/p/w188_and_h282_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 2x"

data-loaded="true">

</body>

</html>

您可以像這樣解析“海報”圖像：

import io

from bs4 import BeautifulSoup

with io.open("demo.html", encoding="utf8") as fd:

soup = BeautifulSoup(fd.read(), features="html.parser")

posters = soup.find_all("img", {"class": "lazyloaded"})

for poster in posters:

print(poster["src"])

你得到：

https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg

反對回復(fù) 2023-02-07

1 回答
0 關(guān)注
164 瀏覽

關(guān)注

添加回答

舉報

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

提取 src 屬性

提取 src 屬性

1 回答

添加回答