簡(jiǎn)介:在這個(gè)時(shí)代,數(shù)據(jù)越來(lái)越重要,數(shù)據(jù)=金錢(qián),已經(jīng)成為定理。本課程讓你初步掌握使用Python進(jìn)行數(shù)據(jù)采集,以及如何從TXT和PDF文檔中讀取數(shù)據(jù),掌握本課程,創(chuàng)造屬于你的價(jià)值
第2章 環(huán)境搭建
對(duì)課程中所需要的開(kāi)發(fā)環(huán)境進(jìn)行搭建
第3章 urllib 和 BeautifulSoup
本章講解urllib和BeautifulSoup的使用
第4章 存儲(chǔ)數(shù)據(jù)到MySQL
學(xué)會(huì)使用pymysql模塊在Python3中操作MySQL數(shù)據(jù)庫(kù)
第5章 常見(jiàn)文檔讀取(TXT, PDF)
主要講解如何使用pdfminer3k進(jìn)行PDF文檔的讀取
第6章 使用爬蟲(chóng)需要注意什么
介紹爬蟲(chóng)robots協(xié)議,以及使用過(guò)程中如何避免法律責(zé)任
第7章 課程總結(jié)
本章對(duì)所學(xué)知識(shí)點(diǎn)進(jìn)行總結(jié),并對(duì)內(nèi)容進(jìn)行簡(jiǎn)單回顧