慕標(biāo)琳琳
2022-11-29 17:06:16
這個(gè)網(wǎng)址 https://ihmecovid19storage.blob.core.windows.net/latest/ihme-covid19.zip包含 2 個(gè) csv 文件和 1 個(gè)每天更新的 pdf,其中包含 Covid-19 數(shù)據(jù)。我希望能夠?qū)⑵銼ummary_stats_all_locs.csv作為 Pandas DataFrame 加載。通常,如果有指向 csv 的 url,我就可以使用df = pd.read_csv(url),但由于 csv 在 zip 中,我不能在這里這樣做。我該怎么做?謝謝
1 回答

米琪卡哇伊
TA貢獻(xiàn)1998條經(jīng)驗(yàn) 獲得超6個(gè)贊
您需要先獲取文件,然后使用ZipFile模塊加載它。Pandas 實(shí)際上可以從 zip 中讀取 csvs,但這里的問(wèn)題是有多個(gè),所以我們需要指定文件名。
import requests
import pandas as pd
from zipfile import ZipFile
from io import BytesIO
r = requests.get("https://ihmecovid19storage.blob.core.windows.net/latest/ihme-covid19.zip")
files = ZipFile(BytesIO(r.content))
pd.read_csv(files.open("2020_05_16/Summary_stats_all_locs.csv"))
添加回答
舉報(bào)
0/150
提交
取消