我正在從韋氏網(wǎng)站上抓取所有文字。我想抓取從 az 開始的所有頁面以及其中的所有頁面并將它們保存到文本文件中。我遇到的問題是我只得到表的第一個結(jié)果而不是全部結(jié)果。我知道這是大量文本(大約 500k),但我這樣做是為了自我教育。代碼:import requestsfrom bs4 import BeautifulSoup as bsURL = 'https://www.merriam-webster.com/browse/dictionary/a/'page = 1# for page in range(1, 75):req = requests.get(URL + str(page))soup = bs(req.text, 'html.parser')containers = soup.find('div', attrs={'class', 'entries'})table = containers.find_all('ul')for entries in table: links = entries.find_all('a') name = links[0].text print(name)現(xiàn)在我想要的是從該表中獲取所有條目,但我只獲取第一個條目。我有點(diǎn)被困在這里所以任何幫助將不勝感激。謝謝https://www.merriam-webster.com/browse/medical/a-zhttps://www.merriam-webster.com/browse/legal/a-zhttps://www.merriam-webster.com/browse/dictionary/a-zhttps://www.merriam-webster.com/browse/thesaurus/a-z
添加回答
舉報(bào)
0/150
提交
取消