我試圖從這些表格內(nèi)容中獲取 href,但在 html 代碼中不可用。[edited @ 3:44 pm 10/02/2019] 我會每天抓取這個網(wǎng)站和其他類似的網(wǎng)站,并與“昨天”的數(shù)據(jù)進行比較。所以我得到了這個數(shù)據(jù)中的每日新信息。[/編輯]我找到了一個類似(但更簡單)的解決方案,但它使用 chromedriver(鏈接)。我正在尋找不使用 Selenium 的解決方案。網(wǎng)站:http ://web.cvm.gov.br/app/esforcosrestritos/#/detalharOferta?ano=MjAxOQ%3D%3D&valor=MTE%3D&comunicado=MQ%3D%3D&situacao=Mg%3D%3D如果您單擊表格的第一部分(如下所示)You will get to this site: http://web.cvm.gov.br/app/esforcosrestritos/#/enviarFormularioEncerramento?type=dmlldw%3D%3D&ofertaId=ODc2MA%3D%3D&state=eyJhbm8iOiJNakF4T1E9PSIsInZhbG9yIjoiTVRFPSIsImNvbXVuaWNhZG8iOiJNUT09Iiwic2l0dWFjYW8iOiJNZz09In0%3D如何抓取第一個站點以獲取它在表格中的所有鏈接?(去第二個“鏈接”)當我使用 requests.get 時,它甚至沒有得到表格的內(nèi)容。有什么幫助嗎?link_cvm = "http://web.cvm.gov.br/app/esforcosrestritos/#/detalharOferta?ano=MjAxOQ%3D%3D&valor=MTE%3D&comunicado=MQ%3D%3D&situacao=Mg%3D%3D"import requestshtml_code = requests.get(link_cvm)html_code.textprint(html_code)
1 回答

牛魔王的故事
TA貢獻1830條經(jīng)驗 獲得超3個贊
您進入的第二個頁面是使用 jscript 動態(tài)加載的。您要查找的數(shù)據(jù)以 json 格式包含在另一個頁面中。搜索一下,有很多關(guān)于此的信息,其中之一,例如,看到這個。
在您的情況下,您可以通過以下方式獲得它:
import requests
import json
url = 'http://web.cvm.gov.br/app/esforcosrestritos/enviarFormularioEncerramento/getOfertaPorId/8760'
resp = requests.get(url)
data = json.loads(resp.content)
print(data)
輸出是該頁面上的信息。
添加回答
舉報
0/150
提交
取消