久久精品中文字幕免费,精品老熟妇,日本在线一区二区三区欧美

首頁免費(fèi)課 Python開發(fā)簡單爬蟲問答

Python開發(fā)簡單爬蟲

            
                螞蟻帥帥
            
            全棧工程師
                    
                難度初級
            
                時長 1小時14分
            
                學(xué)習(xí)人數(shù)
            
綜合評分9.67
                            646人評價
                        查看評價
                                9.9
                                內(nèi)容實(shí)用
                            
                                9.6
                                簡潔易懂
                            
                                9.5
                                邏輯清晰

全部評論問答未解決精華

老師，您好！我安裝的是anaconda2，在eclipse里面運(yùn)行5-3的代碼的時候，提示沒有urllib2

最新回答 / linydee

python版本是2.7.12

2 回答 2245 瀏覽 5-3 Python爬蟲urlib2實(shí)例代碼演示

2016-09-21

好傷心不知道哪里錯了只運(yùn)行一條，也不報錯，也打印不出來求救?。。?/i>

最新回答 / DUO_1080
看看output那個py文件有沒有錯

2 回答 711 瀏覽 7-7 開始運(yùn)行爬蟲和爬取結(jié)果展示
2016-09-20

課程代碼對比排錯

最新回答 / VDer
在Linux上用PyCharm寫了一遍，放到Github上了

1 回答 384 瀏覽
2016-09-20

爬取的數(shù)據(jù)還是亂碼

最贊回答 / wang4142
導(dǎo)出的out.html頁面，瀏覽器默認(rèn)打開的是gbk編碼，修改下為utf-8編碼就好了

5 回答 1047 瀏覽 7-6 HTML輸出器
2016-09-20

mac系統(tǒng) pydev在eclipse中的快捷鍵control＋1沒有用 comannd＋1也只有圖片中的幾種模式

最新回答 / 重口小耳朵
說明你沒有New PyDev Module XXXX

2 回答 1647 瀏覽 7-2 調(diào)度程序
2016-09-20

No module named bs4 說我沒有裝bs4.

已采納回答 / 慕粉18001275658
<...圖片...>應(yīng)該這樣安裝才行

3 回答 28256 瀏覽 6-4 BeautifulSoup實(shí)例測試
2016-09-14

運(yùn)行報錯，怎么回事，看不懂！

最新回答 / UFO2015
# 初始化 class```pyclass UrlManage(object):? def __init__(self):? ? self.new_urls = set();? ? self.old_urls = set();? def add_new_url(self, url):? ? # todo```

3 回答 615 瀏覽 7-2 調(diào)度程序
2016-09-13

PyCharm : 報錯提示： too broad exception clauses 的完美解決方案！

最新回答 / UFO2015
```pyexcept?Exception?as?e:? logging.exception(e)? print?'error'```

3 回答 12798 瀏覽 7-2 調(diào)度程序
2016-09-13

有小伙伴有分享一下老師的完整代碼嗎？我的現(xiàn)在出了點(diǎn)問題，想跟老師的對比一下

已采納回答 / UFO2015
https://github.com/xgqfrms/Python/tree/master/spider/wiki_baike

1 回答 428 瀏覽 8-1 課程總結(jié)
2016-09-13

爬蟲程序無法運(yùn)行can't find _main_ module in this folder

已采納回答 / sin丶
下載代碼后發(fā)現(xiàn)問題還是挺多的，除了那個outputer，在html_parser下data寫成date，title也打錯了,參數(shù)page_url也沒設(shè)置。html_outputer里，方法output_html沒有寫進(jìn)去標(biāo)題。慢慢改吧。

2 回答 935 瀏覽 8-1 課程總結(jié)
2016-09-13

redis 為什么是大公司的工具呀，明明是開源的好不好，不會用是你自己的問題！

最贊回答 / 東圍居士
mysql也是開源的吖因?yàn)閙ysql相對較慢，大公司對性能要求高，所以更加適合使用redis何必激動

1 回答 870 瀏覽 4-2 Python爬蟲URL管理器的實(shí)現(xiàn)方式
2016-09-12

python 3.4 urllib2 不能用

最新回答 / 慕粉3182733
python3里面沒有urllib2，只有urllib，跟2的用法不一樣。我同時安裝了python2和3，在解釋2編寫的代碼的時候用2的解釋器，解釋3編寫的代碼的時候用3的解釋器。開發(fā)環(huán)境是pycharm，可以更改settings里面的interpreter。如果是命令行的話可以用py -2或者py -3運(yùn)行程序。如果環(huán)境變量2在前可以省略py -2，3同樣。

2 回答 2255 瀏覽 5-2 Python爬蟲urlib2下載器網(wǎng)頁的三種方法
2016-09-08

有個疑惑不知道怎么優(yōu)化

最新回答 / 否則悲傷從何而來
那你唯一需要修改的就是“然后又隨機(jī)選一個鏈接接著爬”，這邊的規(guī)則應(yīng)該是你自己想的算法吧建議你寫一個方法，把和當(dāng)前url的關(guān)鍵詞按照某種規(guī)律，把當(dāng)前頁面的所有url“過濾”成自己需要的有“相關(guān)性”URL，就在UrlManger里面的get_new_url下，比如self.new_urls.getMyRulUrl(self.new_urls)

1 回答 538 瀏覽 7-6 HTML輸出器
2016-09-07

卡住了怎么辦

最新回答 / 慕粉3975934
用ctrl+c退出，Python運(yùn)行比較慢

1 回答 576 瀏覽 7-6 HTML輸出器
2016-09-07

ctr+1(Pycharm編輯器)create class如何調(diào)出

已采納回答 / vsyour
alt+回車

3 回答 2442 瀏覽 7-2 調(diào)度程序
2016-09-06

首頁上一頁 66 67 68 69 70 71 72 下一頁尾頁

該課程已下架

課程須知

本課程是Python語言開發(fā)的高級課程 1、Python編程語法； 2、HTML語言基礎(chǔ)知識； 3、正則表達(dá)式基礎(chǔ)知識；

老師告訴你能學(xué)到什么？

1、爬蟲技術(shù)的含義和存在價值 2、爬蟲技術(shù)架構(gòu) 3、組成爬蟲的關(guān)鍵模塊：URL管理器、HTML下載器和HTML解析器 4、實(shí)戰(zhàn)抓取百度百科1000個詞條頁面數(shù)據(jù)的抓取策略設(shè)定、實(shí)戰(zhàn)代碼編寫、爬蟲實(shí)例運(yùn)行 5、一套極簡的可擴(kuò)展爬蟲代碼，修改本代碼，你就能抓取任何互聯(lián)網(wǎng)網(wǎng)頁！

微信掃碼，參與3人拼團(tuán)

你發(fā)的評論可能會是問題？
是否將他發(fā)到問答中

熱搜

最近搜索清空

Python開發(fā)簡單爬蟲