1 回答

TA貢獻1827條經(jīng)驗 獲得超8個贊
狀態(tài)代碼429表示連接過多。下載器上的請求計數(shù)為 1,因為 429 表示拒絕并且不會通過下載器。他們錯誤地向他們認(rèn)為是機器人的任何請求提供 429 代碼。
經(jīng)過實驗后,由于缺少 cookie 標(biāo)頭,它拒絕了我,該 cookie 標(biāo)頭是在 set-cookie 標(biāo)頭的初始 GET 請求中設(shè)置的。這里有一些嘗試將 Selenium 作為任何抓取項目中的最后一個選項。
嘗試使用像下面這樣的完整標(biāo)題和COOKIES_ENABLED = True.
Host: www.realestate.com.au
User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:77.0) Gecko/20100101 Firefox/77.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Accept-Language: en-US,en;q=0.5
Accept-Encoding: gzip, deflate, br
Referer: https://duckduckgo.com/
Connection: keep-alive
Upgrade-Insecure-Requests: 1
Pragma: no-cache
Cache-Control: no-cache
TE: Trailers
添加回答
舉報