第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

關(guān)于抓取,如何防止在 for 循環(huán)中創(chuàng)建空白列表?

關(guān)于抓取,如何防止在 for 循環(huán)中創(chuàng)建空白列表?

qq_花開花謝_0 2021-10-26 19:01:45
import urllib.requestimport bs4 as bssauce = urllib.request.urlopen('https://en.wikipedia.org/wiki/List_of_S%26P_500_companies').read().decode()soup = bs.BeautifulSoup(sauce, 'lxml')soup.th.decompose()table = soup.find('table')trows = soup.find_all('tr')for trow in trows:    td = trow.find_all('td')    row = [x.text for x in td]    print(row)我一直在玩抓取網(wǎng)頁和表格似乎是最難的。但是,我能夠很好地創(chuàng)建表數(shù)據(jù)的行列表。問題是有一個由于表頭而打印的空白列表<th>。當(dāng)我只想打印row[0]并且row[1]因為它返回 this時,這會產(chǎn)生問題"IndexError: list index out of range"。我知道這是因為<th>屬于<tr>但沒有<td>.在查看了 bs4 文檔后,我嘗試使用.decompose()刪除<th>標(biāo)題無濟于事。仍然會生成一個空列表。對此事的任何幫助將不勝感激。謝謝你。
查看完整描述

1 回答

  • 1 回答
  • 0 關(guān)注
  • 175 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號