我正在嘗試提取高爾夫統(tǒng)計(jì)數(shù)據(jù)以進(jìn)行分析項(xiàng)目。TL;DR 摘要:我應(yīng)該抓取還是使用在網(wǎng)絡(luò)控制臺(tái)中找到的 API 的循環(huán)?我想按年份(2015 年至今)提取 6 或 7 個(gè)統(tǒng)計(jì)類(lèi)別的數(shù)據(jù),最好按錦標(biāo)賽提取數(shù)據(jù),以便更好地對(duì)玩家錦標(biāo)賽表現(xiàn)進(jìn)行分類(lèi)?;揪W(wǎng)址是:https://www.pgatour.com/stats該網(wǎng)站有很多頁(yè)面,一旦您單擊特定的統(tǒng)計(jì)頁(yè)面,它就會(huì)顯示三個(gè)下拉字段:季節(jié)(包含年份)、時(shí)間段(僅限錦標(biāo)賽或年初至今)和錦標(biāo)賽(錦標(biāo)賽名稱)發(fā)現(xiàn)可能隱藏的API:https://statdata-api-prod.pgatour.com/api/clientfile/YTDEventStats?T_CODE=r&STAT_ID=02671&YEAR=2021&format=json但這僅包含最近錦標(biāo)賽的數(shù)據(jù),并且不是很干凈(表數(shù)據(jù)沒(méi)有統(tǒng)計(jì)類(lèi)別標(biāo)題):我可以通過(guò)更改 Stat ID=值和年份來(lái)調(diào)整 JSON API。所以這是一個(gè)選項(xiàng),但我必須弄清楚如何僅將錦標(biāo)賽 ID 號(hào)和錦標(biāo)賽統(tǒng)計(jì)數(shù)據(jù)添加為鍵值對(duì)。示例的 URL 如下所示:https://www.pgatour.com/content/pgatour/stats/stat.02674.y2017.eon.t030.html eon 僅進(jìn)行統(tǒng)計(jì)錦標(biāo)賽(eoff 表示 YTD),t030 是錦標(biāo)賽標(biāo)記。我是否應(yīng)該創(chuàng)建循環(huán)并更改年份、錦標(biāo)賽編號(hào)和統(tǒng)計(jì)編號(hào)并獲取 JSON 中的所有信息并嘗試將其放入 df 中?如何將錦標(biāo)賽和 eon 預(yù)選賽添加為 JSON url 中的鍵值對(duì)?這可行嗎?或者我應(yīng)該抓取它并嘗試使用 HTML(可能能夠捕獲統(tǒng)計(jì)行標(biāo)題)?包括網(wǎng)站上一張桌子的快照
添加回答
舉報(bào)
0/150
提交
取消