第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

python selenium webdriver 不顯示所有 html

python selenium webdriver 不顯示所有 html

白豬掌柜的 2023-08-18 17:10:12
我正在用 python 開發(fā)一個(gè)網(wǎng)絡(luò)爬蟲。這是我的代碼:from selenium.webdriver.chrome.options import Optionsfrom selenium import webdriverfrm bs4 import BeautifulSoupchrome_options = Options()chrome_options.add_argument("--headless")driver = webdriver.Chrome(options=chrome_options)driver.get("https://www.hapag-lloyd.com/en/home.html")source = driver.page_sourcesoup = BeautifulSoup(source, 'html.parser')print(soup)但返回的 html 與我在瀏覽器上看到的不同(請(qǐng)檢查最后幾行):<html><head><meta content="no-cache" http-equiv="Pragma"/><meta content="-1" http-equiv="Expires"/><meta content="no-cache" http-equiv="CacheControl"/><meta content="text/html; charset=utf-8" http-equiv="Content-Type"/><link href="data:;base64,iVBORw0KGgo=" rel="shortcut icon"/><script>(function(){window["bobcmn"] = "111110101010102000000022000000052000000002a4b927ad200000096300000000300000000300000006/TSPD/300000008TSPD_101300000005https3000000b0081ecde62cab2000d65f90c7efd5185e314a8800e00a5aad11b1a439eb174c6c3f64d45284e14d9508dcf0830d0a2800346a2db5907272d4309ad725a7dc856ab98589c10724bd284477ca152744f4ac2102b44d72e2a1e9200000000200000000";SS(RegExp("\x3c")[l(1372127,sZ)](function(){return"\x3c"})&!RegExp(l(42811,sZ))[l(1372127,sZ)](function(){return"'x3'+'d';"}));})();</script><script src="/TSPD/081ecde62cab200082f75af3905bec19af31f4aaf7bd4079c3ac5a62a6fb4096cfcec166097ddde7?type=7" type="text/javascript"></script><noscript>Please enable JavaScript to view the page content.<br/>Your support ID is: 17324345507588527622.</noscript></head><body><form action="" enctype="multipart/form-data" method="post"><input name="_pd" type="hidden" value=""/></form></body></html>它報(bào)告“請(qǐng)啟用 JavaScript 以查看頁(yè)面內(nèi)容。您的支持 ID 是:17324345507588527622?!薄N也榱艘恍┢渌税l(fā)起的查詢。這個(gè)問題應(yīng)該通過使用chrome來解決。我還嘗試使用 requests-html 獲取 html。但程序只是繼續(xù)運(yùn)行并且不返回任何東西。
查看完整描述

1 回答

?
侃侃爾雅

TA貢獻(xiàn)1801條經(jīng)驗(yàn) 獲得超16個(gè)贊

這是 page_source 方法的限制。

并查看源代碼:

從接口復(fù)制的描述:WebDriver 獲取最后加載頁(yè)面的源。如果頁(yè)面在加載后被修改(例如,通過 Javascript),則不能保證返回的文本是修改后的頁(yè)面的文本。請(qǐng)查閱所使用的特定驅(qū)動(dòng)程序的文檔,以確定返回的文本是否反映了頁(yè)面的當(dāng)前狀態(tài)或 Web 服務(wù)器上次發(fā)送的文本。返回的頁(yè)面源是底層 DOM 的表示:不要期望它以與 Web 服務(wù)器發(fā)送的響應(yīng)相同的方式進(jìn)行格式化或轉(zhuǎn)義。將其視為藝術(shù)家的印象。


查看完整回答
反對(duì) 回復(fù) 2023-08-18
  • 1 回答
  • 0 關(guān)注
  • 255 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)