首頁猿問 requests 和 bs4...

requests 和 bs4 無法讀取整個 html

Html5

呼啦一陣風(fēng) 2023-09-04 16:09:58

我試圖獲取此網(wǎng)站列表中的所有 href：https://nihongonosei.net/?page_id =10246 。該網(wǎng)站非常簡單干凈。查看源代碼后，我發(fā)現(xiàn)沒有任何動態(tài)。但是，如果我這樣做import requestsurl = 'https://nihongonosensei.net/?page_id=10246'r = requests.get(url)r.textr.text僅包含約20000個字符信息。超過一半的 html 丟失了。我嘗試從“查看頁面源代碼”復(fù)制整個 HTML 并直接加載到 Beautifulsoup：from bs4 import BeautifulSouphtml = '' # too long to copy. Here is the link: view-source:https://nihongonosensei.net/?page_id=10246 soup = BeautifulSoup(html, 'html.parser')仍然只保留了大約 20000 個字符，并且 html 的上半部分丟失了。這是我的問題：requests和是否有字符限制BeautifulSoup？如果是這樣，我該如何取消限制？如果沒有，為什么我無法獲取完整的 html？多謝！

查看完整描述

目前暫無任何回答