首頁猿問 Python 網(wǎng)頁抓取多個(gè)頁面

Python 網(wǎng)頁抓取多個(gè)頁面

Python

千巷貓影 2023-12-12 15:51:48

我正在從韋氏網(wǎng)站上抓取所有文字。我想抓取從 az 開始的所有頁面以及其中的所有頁面并將它們保存到文本文件中。我遇到的問題是我只得到表的第一個(gè)結(jié)果而不是全部結(jié)果。我知道這是大量文本（大約 500k），但我這樣做是為了自我教育。代碼：import requestsfrom bs4 import BeautifulSoup as bsURL = 'https://www.merriam-webster.com/browse/dictionary/a/'page = 1# for page in range(1, 75):req = requests.get(URL + str(page))soup = bs(req.text, 'html.parser')containers = soup.find('div', attrs={'class', 'entries'})table = containers.find_all('ul')for entries in table: links = entries.find_all('a') name = links[0].text print(name)現(xiàn)在我想要的是從該表中獲取所有條目，但我只獲取第一個(gè)條目。我有點(diǎn)被困在這里所以任何幫助將不勝感激。謝謝https://www.merriam-webster.com/browse/medical/a-zhttps://www.merriam-webster.com/browse/legal/a-zhttps://www.merriam-webster.com/browse/dictionary/a-zhttps://www.merriam-webster.com/browse/thesaurus/a-z

查看完整描述