現(xiàn)在百度的網(wǎng)址做了修改,以前慕課網(wǎng)上的python爬蟲代碼無法爬取數(shù)據(jù),主要還是每個URL不再是http://baike.baidu.com/view/數(shù)字.htm。里面的超鏈接的網(wǎng)址也不再是簡單有規(guī)律的了,后面是一串很長沒有規(guī)律的東西,請問哪位大神知道怎么爬取百度百科的數(shù)據(jù),剛學爬蟲,什么都不會。
添加回答
舉報
0/150
提交
取消