我有一張跨越很多頁的表格。我能夠從指定頁面提取信息并將其提取到 CSV 表中。我現(xiàn)在的目標是讓它迭代所有頁面并將其添加到上一頁信息的底部。這是迄今為止在單個頁面上運行的代碼:import requestsimport pandas as pdurl = 'https://www.mineralanswers.com/oklahoma/producers?page=1'html = requests.get(url).contentdf_list = pd.read_html(html)df = df_list[-1]print(df)df.to_csv('my data.csv')頁面 URL 設置為“... Producers?page = 1,... Producers?page = 2 ... Producers?page = 3”格式,所以我覺得可能使用循環(huán),我只是有麻煩修改數據而不是覆蓋它。
1 回答

鴻蒙傳說
TA貢獻1865條經驗 獲得超7個贊
以下是更正后的示例代碼,用于獲取 3 頁并將它們附加到一個 DataFrame。
import requests
import pandas as pd
df = pd.DataFrame()
for page in range(1, 4):
? ? url = 'https://www.mineralanswers.com/oklahoma/producers?page=' + str(page)
? ? html = requests.get(url).content
? ? df_list = pd.read_html(html)
? ? df = df.append(df_list[-1], ignore_index = True)
df.to_csv('my data.csv')
添加回答
舉報
0/150
提交
取消