首頁(yè) 猿問(wèn) 報(bào)紙圖書(shū)館、

報(bào)紙圖書(shū)館、

Python

慕桂英3389331 2021-08-17 10:55:47

作為使用 python 主題的絕對(duì)新手，我在使用報(bào)紙庫(kù)擴(kuò)展時(shí)遇到了一些困難。我的目標(biāo)是定期使用報(bào)紙擴(kuò)展程序下載名為“tagesschau”的德國(guó)新聞網(wǎng)站的所有新文章和 CNN 的所有文章，以構(gòu)建我可以在幾年內(nèi)進(jìn)行分析的數(shù)據(jù)堆棧。如果我做對(duì)了，我可以使用以下命令下載所有文章并將其抓取到 python 庫(kù)中。import newspaperfrom newspaper import news_pooltagesschau_paper = newspaper.build('http://tagesschau.de')cnn_paper = newspaper.build('http://cnn.com')papers = [tagesschau_paper, cnn_paper]news_pool.set(papers, threads_per_source=2) # (3*2) = 6 threads totalnews_pool.join()`如果這是下載所有文章的正確方法，那么我如何在 python 之外提取和保存這些文章？或者將這些文章保存在 python 中，以便我再次重新啟動(dòng) python 時(shí)可以重用它們？

查看完整描述

2 回答

素胚勾勒不出你

TA貢獻(xiàn)1827條經(jīng)驗(yàn) 獲得超9個(gè)贊

您可以使用 pickle 在 python 之外保存對(duì)象并稍后重新打開(kāi)它們：

file_Name = "testfile"

# open the file for writing

fileObject = open(file_Name,'wb')

# this writes the object news_pool to the

# file named 'testfile'

pickle.dump(news_pool,fileObject)

# here we close the fileObject

fileObject.close()

# we open the file for reading

fileObject = open(file_Name,'r')

# load the object from the file into var news_pool_reopen

news_pool_reopen = pickle.load(fileObject)

反對(duì) 回復(fù) 2021-08-17

2 回答
0 關(guān)注
163 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書(shū)簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

報(bào)紙圖書(shū)館、

報(bào)紙圖書(shū)館、

2 回答

添加回答

報(bào)紙圖書(shū)館、