1 回答

TA貢獻(xiàn)1859條經(jīng)驗(yàn) 獲得超6個(gè)贊
做爬蟲一定要用最“直接”的方法來(lái)解決問(wèn)題。
比如你說(shuō)的有一個(gè)動(dòng)態(tài)的img值,那你要獲取動(dòng)態(tài)改變之后的值,就應(yīng)該關(guān)注改變的過(guò)程本身,而不是順著一個(gè)時(shí)間順序關(guān)注整體過(guò)程的每一步。
簡(jiǎn)單來(lái)說(shuō),是哪個(gè)JS文件在改變圖片的src,具體又是其中的哪一行?可能JS文件經(jīng)過(guò)壓縮合并之后你很難讀懂,那就從數(shù)據(jù)的流動(dòng)上入手,這個(gè)改變之后的src值是和整個(gè)document一起獲取回來(lái)的嗎?還是放置在某個(gè)JS文件中儲(chǔ)存?還是在觸發(fā)src更改之后,再異步獲取然后填充進(jìn)來(lái)的?
只要抓到了你需要的數(shù)據(jù),再找到它的規(guī)則,比如如何根據(jù)主url獲得這個(gè)改變圖片的src,再根據(jù)這個(gè)規(guī)則去直接獲取就好了。
模擬瀏覽器行為有時(shí)候也會(huì)用到,但大部分情況下不需要。
添加回答
舉報(bào)