我正在嘗試從該網(wǎng)站獲取電影劇本作為文本。直到某一點(diǎn),文本變成這樣:5 . / b > T H E W A L L S C O M E A L I V E ! A s e e m i n g l y i n f i n i t e s w a r m o f F I R E D E M O N S r a l l y t o S u r t u r ' s a i d . 這是我的代碼import requestsfrom bs4 import BeautifulSoupwebsite_url = requests.get("https://www.imsdb.com/scripts/Thor-Ragnarok.html").textsoup = BeautifulSoup(website_url, "lxml")text = soup.pre打印出來(lái)時(shí)text,它會(huì)顯示預(yù)期的輸出,直到第 5 節(jié)。然后我看到上面的文字很煩人...關(guān)于為什么會(huì)發(fā)生這種情況以及如何解決它的任何想法?
2 回答

慕斯709654
TA貢獻(xiàn)1840條經(jīng)驗(yàn) 獲得超5個(gè)贊
奇怪...我在我的機(jī)器上嘗試了你的原始代碼,但我無(wú)法重現(xiàn)你描述的間距問(wèn)題。我有 lxml-4.3.0、bs4 版本 4.7.1 和 python 3.7.1。你有哪些版本?
添加回答
舉報(bào)
0/150
提交
取消