很多細(xì)節(jié)老師不注意
比如變量聲明等的細(xì)節(jié)上的習(xí)慣,和不加分號(hào)等很基本的習(xí)慣 ,老師都很不注意,會(huì)讓新手很容易看你的視頻后也養(yǎng)成主種習(xí)慣的。。。希望老師能多提高自己的寫(xiě)作規(guī)范。。
包括這個(gè)示例里對(duì)抓取數(shù)據(jù)的邏輯也存在一些BUG。比如想拿人等頁(yè)面渲染后才異步取的數(shù)據(jù),在這個(gè)示例中抓取的是HTML頁(yè)面,并不會(huì)執(zhí)行JS腳本,怎么能抓 到這些數(shù)據(jù) 呢?除非整 個(gè)HTML文檔是后后臺(tái)渲染好的。。
2016-12-29
不加分號(hào)怎么說(shuō)呢,你寫(xiě)PHP,C++,JAVA不寫(xiě)分號(hào)肯定不對(duì),但是你寫(xiě)Python或者JS就可以,因?yàn)槿思揖筒皇强糠痔?hào)來(lái)分割的。Python必須依靠Tab空格來(lái)基本上沒(méi)分號(hào)。個(gè)人習(xí)慣
2017-03-14
加了分號(hào)就比較嚴(yán)謹(jǐn)
2016-12-29
還有比如你想等人家把HTML頁(yè)面渲染好,也就是JS代碼允許結(jié)束,之前用Python和phantomJS爬去過(guò),你可以設(shè)置程序暫停五秒鐘或者一個(gè)合適的時(shí)間等頁(yè)面JS數(shù)據(jù)加載完畢,再去抓去HTML頁(yè)面。
2016-12-29
你爬去數(shù)據(jù),只能爬去靜態(tài)數(shù)據(jù),不管是PHP的curl還是Python的request庫(kù)或者utrl。你如果想獲取JS渲染的數(shù)據(jù)可以百度一下phantomJS,無(wú)頭瀏覽器,老師當(dāng)時(shí)寫(xiě)的時(shí)候人數(shù)是靜態(tài)數(shù)據(jù),人家慕課網(wǎng)的代碼是會(huì)變化的,老師只是教你思路,或者指點(diǎn)你方向,小的細(xì)節(jié)還要靠你自己,不可能以后你做的項(xiàng)目都是你在慕課網(wǎng)或者其他網(wǎng)站學(xué)的一模一樣。
2016-12-15
不同的派系的編碼風(fēng)格對(duì)變量和封號(hào)要求是不一樣的;
您可能還不知道爬蟲(chóng)和get是怎么回事;