第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

提取 src 屬性

提取 src 屬性

慕田峪7331174 2023-02-07 14:55:36
我想做的事:這個 HTML 代碼:<img class="poster lazyload lazyloaded"     data-src="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg"     data-srcset="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 1x, https://image.tmdb.org/t/p/w188_and_h282_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 2x"     alt="Hitman"     src="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg"     srcset="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 1x, https://image.tmdb.org/t/p/w188_and_h282_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 2x"     data-loaded="true">我想提取“data-src”或“src”(或包含圖像 URL 的每個屬性)屬性值。我試過的:Posters = soup.find("img")["src"]print(Posters)但這顯然會返回每個 img 標簽的所有值,因此每個鏈接都與海報無關(guān)。輸出:https://www.themoviedb.org/assets/2/v4/logos/v2/blue_short-8e7b30f73a4020692ccca9c88bafe5dcb6f8a62a4c6bc55cd9ba82bb2cd95f6c.SVGhttps://www.themoviedb.org/assets/2/v4/logos/v2/blue_short-8e7b30f73a4020692ccca9c88bafe5dcb6f8a62a4c6bc55cd9ba82bb2cd95f6c.SVG對于海報,我指的是(檢查此 URL https://www.themoviedb.org/search?&query=Hitman:)電影海報。概括我想在類“.lazyloaded”中提取屬性內(nèi)的值我希望一切都清楚。謝謝。
查看完整描述

1 回答

?
飲歌長嘯

TA貢獻1951條經(jīng)驗 獲得超3個贊

您可以嘗試過濾class:


posters  = soup.find_all("img", {"class": "lazyloaded"})


for poster in posters:

    print(poster["src"])

請參閱文檔:https ://www.crummy.com/software/BeautifulSoup/bs4/doc/#searching-by-css-class


編輯:更多解釋


假設(shè)您有以下文件demo.html:


<!DOCTYPE html>

<html>

<head>

  <meta charset="UTF-8">

  <title>Title</title>

</head>

<body>

<img class="logo" src="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg">

<img class="poster lazyload lazyloaded"

     data-src="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg"

     data-srcset="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 1x, https://image.tmdb.org/t/p/w188_and_h282_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 2x"

     alt="Hitman"

     src="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg"

     srcset="https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 1x, https://image.tmdb.org/t/p/w188_and_h282_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg 2x"

     data-loaded="true">

</body>

</html>

您可以像這樣解析“海報”圖像:


import io


from bs4 import BeautifulSoup


with io.open("demo.html", encoding="utf8") as fd:

    soup = BeautifulSoup(fd.read(), features="html.parser")


posters = soup.find_all("img", {"class": "lazyloaded"})


for poster in posters:

    print(poster["src"])

你得到:


https://image.tmdb.org/t/p/w94_and_h141_bestv2/3qlQM9KP1cyvNfPChA9rASASdHr.jpg


查看完整回答
反對 回復(fù) 2023-02-07
  • 1 回答
  • 0 關(guān)注
  • 164 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號