關(guān)于拉勾改版無法爬取數(shù)據(jù)問題如何解決?
老師我大概在20年左右,根據(jù)老師的課程把整個(gè)框架搭起來了,相關(guān)的數(shù)據(jù)也爬取到了
但是在最近我需要重新分析一些崗位的時(shí)候發(fā)現(xiàn),拉勾改變了頁面的規(guī)則,目前發(fā)現(xiàn)的問題有:
使用爬蟲請求頁面時(shí),返回的html為【加載中。。?!康囊粋€(gè)等待頁面,不包含任何有價(jià)值的數(shù)據(jù)
使用selenium框架,也仍然獲取不到數(shù)據(jù)接口的源碼
調(diào)試頁面發(fā)現(xiàn),拉勾目前所有的數(shù)據(jù)接口,返回的json數(shù)據(jù)都是進(jìn)行過加密的
由于需要用這個(gè)項(xiàng)目的網(wǎng)頁做一些展示,不知老師上述問題是否有解決方案?
如果有,麻煩老師告知一下,如果此問題暫時(shí)未能解決,老師可否給一份往期的歷史數(shù)據(jù)?希望能夠順利訪問頁面的數(shù)據(jù)就行