課程
/后端開發(fā)
/Python
/Python開發(fā)簡單爬蟲
def parse(self, page_url, html_cont):
????? pass
2016-03-16
源自:Python開發(fā)簡單爬蟲 7-5
正在回答
視頻引用的是2.7的python,在3.*里面大量寫法全部改變了
urljoin函數,哈哈 ?其實老師在視頻里面都說的很清楚啦
終于懂了~_~
用help查看發(fā)現(xiàn)
JoshuaShang
問題在于urlparse.urljoin(page_url, new_url),是如何將當前爬取得url,和從這個url爬取出的新的不完整的url拼接起來的呢?
懂了,是spider_main中傳入的url
mirrornighthehe 提問者
舉報
本教程帶您解開python爬蟲這門神奇技術的面紗
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號-11 京公網安備11010802030151號
購課補貼聯(lián)系客服咨詢優(yōu)惠詳情
慕課網APP您的移動學習伙伴
掃描二維碼關注慕課網微信公眾號
2016-04-24
視頻引用的是2.7的python,在3.*里面大量寫法全部改變了
2016-04-24
urljoin函數,哈哈 ?其實老師在視頻里面都說的很清楚啦
2016-03-16
終于懂了~_~
2016-03-16
用help查看發(fā)現(xiàn)
2016-03-16
問題在于urlparse.urljoin(page_url, new_url),是如何將當前爬取得url,和從這個url爬取出的新的不完整的url拼接起來的呢?
2016-03-16
懂了,是spider_main中傳入的url