亚洲视频成人,最近更新中文字幕在线

首頁免費課 Python開發(fā)簡單爬蟲問答

Python開發(fā)簡單爬蟲

            
                螞蟻帥帥
            
            全棧工程師
                    
                難度初級
            
                時長 1小時14分
            
                學(xué)習(xí)人數(shù)
            
綜合評分9.67
                            646人評價
                        查看評價
                                9.9
                                內(nèi)容實用
                            
                                9.6
                                簡潔易懂
                            
                                9.5
                                邏輯清晰

全部評論問答未解決精華

我用的PyCharm跑的，一直出問題，解釋器選的Python27的

已采納回答 / 鄭小墨

看看你的python27/Lib目錄下的urllib2.py里面有沒有urlopen ? 我的python版本是2.7.13，正常

2 回答 2044 瀏覽 5-3 Python爬蟲urlib2實例代碼演示

2017-06-02

求教大神??！

已采納回答 / 來離

你試試改成 <...code...>

3 回答 1209 瀏覽 5-3 Python爬蟲urlib2實例代碼演示

2017-06-02

我想知道答案

已采納回答 / 慕UI6075258

不應(yīng)該，這些應(yīng)該只是簡單的功能很有可能還有其他的功能，只是沒在這里顯示出來而已。感興趣的話，可以網(wǎng)上搜一下。

1 回答 693 瀏覽 4-1 Python爬蟲URL管理

2017-05-31

url 亂碼怎么搞？？？

已采納回答 / 請叫我百度

在代碼的最頂上加入# coding:utf-8?

2 回答 1027 瀏覽 7-2 調(diào)度程序

2017-05-16

spider_main.py中的from baike_spider import url_manager問題

已采納回答 / 請叫我百度

第一：baike_spider是你創(chuàng)建的包，你所說的url_manager肯定是放在包中的代碼，是可以import進去了。第二：只爬取一個網(wǎng)址就結(jié)束應(yīng)該是html_parser中的代碼有問題，比如課程中的匹配策略與現(xiàn)在的百度Python詞條不匹配，需要改成href = re.compile(r"/item/.*") ? 再或者find_all ?不要丟了下劃線，我就沒注意到下劃線，所以只輸出了1條記錄就craw faild了。

2 回答 1642 瀏覽 8-1 課程總結(jié)

2017-05-15

請問，為什么會報錯

已采納回答 / Toby_0002

參數(shù)沒有初始化成功？

1 回答 544 瀏覽 7-5 HTML解析器html_parser

2017-05-05

爬蟲運行出出現(xiàn)的錯誤

已采納回答 / SiCheng_Sheen

我之前也遇到過這種情況，糾結(jié)了很久，最后才發(fā)現(xiàn)一個非常重要的問題，百度的詞條信息發(fā)生了變化，你可以仔細看看，現(xiàn)在不再是以 .htm結(jié)尾了，之前在html_parser模塊中的正則表達式已經(jīng)失效了，原來是href=re.compile(r"/view/\d+\.htm")，現(xiàn)在應(yīng)該改為href=re.compile(r'/item/\w+')。這也再次證明了在采集數(shù)據(jù)前，一定要對目標進行仔細認真的分析！

4 回答 1070 瀏覽 7-7 開始運行爬蟲和爬取結(jié)果展示

2017-05-05

求助 pip install beautifulsoup4失敗

已采納回答 / 蛋蛋_JL

beautifulsoup4移入到bs4里面去了。。

6 回答 11139 瀏覽 6-2 BeautifulSoup模塊介紹和安裝

2017-04-13

使用pycharm時輸出結(jié)果在瀏覽器上訪問時現(xiàn)實亂碼

最贊回答 / qq_我年輕_0

我也遇到了這個問題，很好解決。你們可以看一下任何一個網(wǎng)站的源碼例如本網(wǎng)站<...code...>他會有這一句句話? <meta charset="utf-8">這就是 html 編碼的約束。所以在 html_outputer.py? 的這句話<...code...>前面添加<...code...>output_html() 方法應(yīng)為：<...code...>

7 回答 4914 瀏覽 7-7 開始運行爬蟲和爬取結(jié)果展示

2017-04-12

有python3.5的爬蟲代碼嗎

已采納回答 / qq_Oak_0

http://blog.csdn.net/stopcpp/article/details/69946607

5 回答 1262 瀏覽 7-7 開始運行爬蟲和爬取結(jié)果展示

2017-04-09

為什么outputer里面collect_data方法的self.datas.append（data）不能寫入數(shù)據(jù)，print為空

已采納回答 / ciphermagic

是因為你的data是None，所以返回了吧。檢查下html_parser的_get_new_data方法，看看查找的節(jié)點數(shù)據(jù)是否有誤

1 回答 1441 瀏覽 7-6 HTML輸出器

2017-04-05

這段代碼哪里錯了，為什么運行不了提示出錯？

已采納回答 / 逍遙游_xj

TypeError: __init__() got an unexpected keyword argument 'from_encoding'構(gòu)造函數(shù)參數(shù)錯誤我猜你用的BeautifulSoup是BeautifulSoup3版本，3版本這個位置參數(shù)是：fromEncoding，你換這個參數(shù)名試一試

5 回答 2259 瀏覽 6-4 BeautifulSoup實例測試

2017-04-04

應(yīng)該先看python進階，還是繼續(xù)跟著視頻敲代碼

已采納回答 / 慕粉1414027800

敲代碼好些

3 回答 1292 瀏覽 7-2 調(diào)度程序

2017-04-03

非常感謝老師 , 第一次接觸python 已經(jīng)會下載圖片啦 , 分享出來大家共同學(xué)習(xí)

已采納回答 / 陳新宇

看了網(wǎng)頁內(nèi)容更加堅定了我學(xué)爬蟲的信念?

2 回答 1309 瀏覽 7-7 開始運行爬蟲和爬取結(jié)果展示

2017-03-26

第二條鏈接中開始含有中文例如這樣 http://baike.baidu.com/item/史記·2016?fr=navbar 就跑不動了

已采納回答 / qq_黑色契約_0

網(wǎng)址哪有中文不要轉(zhuǎn)義網(wǎng)址好伐；summary要轉(zhuǎn)中文

4 回答 865 瀏覽 7-7 開始運行爬蟲和爬取結(jié)果展示

2017-03-25

首頁上一頁 4 5 6 7 8 9 10 下一頁尾頁

該課程已下架

課程須知: 本課程是Python語言開發(fā)的高級課程 1、Python編程語法； 2、HTML語言基礎(chǔ)知識； 3、正則表達式基礎(chǔ)知識；

老師告訴你能學(xué)到什么？: 1、爬蟲技術(shù)的含義和存在價值 2、爬蟲技術(shù)架構(gòu) 3、組成爬蟲的關(guān)鍵模塊：URL管理器、HTML下載器和HTML解析器 4、實戰(zhàn)抓取百度百科1000個詞條頁面數(shù)據(jù)的抓取策略設(shè)定、實戰(zhàn)代碼編寫、爬蟲實例運行 5、一套極簡的可擴展爬蟲代碼，修改本代碼，你就能抓取任何互聯(lián)網(wǎng)網(wǎng)頁！

微信掃碼，參與3人拼團

熱搜

最近搜索清空

Python開發(fā)簡單爬蟲