我正在使用Python Mechanize打開具有這種格式的URL ...https://www.simplewebsite.com?view=discussions#/?page=2當(dāng)頁面打開時...它得到了...https://www.simplewebsite.com?view=discussions完全繞過“#”標(biāo)記之后的內(nèi)容...任何線索如何打開URL?我花了很多時間在網(wǎng)上搜索...沒有一個肯定的答案...
2 回答

慕雪6442864
TA貢獻(xiàn)1812條經(jīng)驗(yàn) 獲得超5個贊
井號之后出現(xiàn)的URL部分是對HTML錨的引用,這些錨由客戶端(通常是Web瀏覽器)處理,并且永遠(yuǎn)不會發(fā)送到服務(wù)器。
該網(wǎng)站可能會加載在頁面加載時運(yùn)行的Javascript代碼。該代碼將解析錨名稱并基于該名稱更新頁面。在這種情況下,很明顯,JavaScript代碼必須將ajax請求發(fā)送到服務(wù)器以獲取第2頁,然后更新HTML文檔以顯示該數(shù)據(jù)。
不幸的是,mechanize無法處理這種類型的網(wǎng)站,因?yàn)樗蕾囉谠诳蛻舳松线\(yùn)行Javascript代碼。您可能可以使用phantom.js(可以運(yùn)行客戶端腳本的無頭Web瀏覽器客戶端)執(zhí)行類似的操作。
添加回答
舉報
0/150
提交
取消