用Python進(jìn)行Web抓取我想從網(wǎng)站上獲取每日日出/日落的時間。是否有可能用Python抓取Web內(nèi)容?使用的模塊是什么?有可用的教程嗎?
3 回答

SMILET
TA貢獻(xiàn)1796條經(jīng)驗 獲得超4個贊
抓取比機械化更快,因為它使用異步操作(在Twisted之上)。 scrapy對libxml 2之上的解析(X)html有更好和最快的支持。 scrapy是一個成熟的框架,包含完整的Unicode、句柄重定向、gzip響應(yīng)、奇數(shù)編碼、集成的http緩存等。 一旦您進(jìn)入Scrapy,您可以在不到5分鐘內(nèi)編寫一個蜘蛛,下載圖像、創(chuàng)建縮略圖并將提取的數(shù)據(jù)直接導(dǎo)出到CSV或JSON。
添加回答
舉報
0/150
提交
取消