第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何分解 Beautifulsoup 中的 HTML 元素以將它們插入 MySQL 數(shù)據(jù)庫表中?

如何分解 Beautifulsoup 中的 HTML 元素以將它們插入 MySQL 數(shù)據(jù)庫表中?

慕森卡 2021-12-29 19:26:27
我正在使用 Beautifulsoup 從網(wǎng)站上抓取文本信息。如何僅抓取選擇的文本,以便將所選文本輸入到 MySQL 數(shù)據(jù)庫?我嘗試了各種方法來拉文本字符串,但我沒有任何運氣。我得到了想要的輸出,只是不知道如何消除不需要的項目。from bs4 import BeautifulSoupimport urllib.request, urllib.parse, urllib.errorhtml_url = 'https://www.nwk.usace.army.mil/Locations/District-Lakes/Pomme-de-Terre-Lake/Daily-Lake-Info-2/' html_doc = urllib.request.urlopen(html_url).read() soup = BeautifulSoup(html_doc, 'html.parser')pageNav = soup.find(class_= 'Normal')pageSub = pageNav.find_all('p')for strong_tag in soup.find_all('strong'):    print (strong_tag.text, strong_tag.next_sibling)我想限制并只將四個項目拉到 MySQL 數(shù)據(jù)庫中:日期、昨天的高點、24 小時的低點、湖面溫度。這是我目前的結(jié)果:日期:2019 年 4 月 3 日正常泳池海拔:839.00 湖泊海拔:843.53 24 小時。變化:+0.14' 排放到 Pomme de Terre 河: Pomme de Terre 河:每秒 50 立方英尺 氣溫 無 8:00 am 48 昨天最高:64 24 小時最低:39 湖面溫度:46(周一拍攝)和星期五大約上午 8:00)河流溫度:46(星期一和星期五大約上午 8:00 拍攝)無風(fēng)方向:東南速度:4 峰值:9 降水:0.00"
查看完整描述

1 回答

?
有只小跳蛙

TA貢獻(xiàn)1824條經(jīng)驗 獲得超8個贊

使用此代碼:


from bs4 import BeautifulSoup

import urllib.request, urllib.parse, urllib.error


html_url = 'https://www.nwk.usace.army.mil/Locations/District-Lakes/Pomme-de-Terre-Lake/Daily-Lake-Info-2/' 


html_doc = urllib.request.urlopen(html_url).read() 


soup = BeautifulSoup(html_doc, 'html.parser')


pageNav = soup.find(class_= 'Normal')


pageSub = pageNav.find_all('p')


for strong_tag in soup.find_all('strong'):

    if strong_tag.text == "24 Hr. Change:" or strong_tag.text=="Yesterday's High:" or strong_tag.text=="Date:    " or strong_tag.text=="Lake Surface Temperature:":

        print(strong_tag.text, strong_tag.next_sibling)

if 語句應(yīng)該對所有內(nèi)容進行排序。我在 jupyter notebook 中嘗試了這段代碼,它奏效了。這里唯一的問題是日期一詞后面有一些空格。所以現(xiàn)在文件不會打印日期行。


要對日期大小寫進行硬編碼,請改用以下代碼:


from bs4 import BeautifulSoup

import urllib.request, urllib.parse, urllib.error


html_url = 'https://www.nwk.usace.army.mil/Locations/District-Lakes/Pomme-de-Terre-Lake/Daily-Lake-Info-2/' 


html_doc = urllib.request.urlopen(html_url).read() 


soup = BeautifulSoup(html_doc, 'html.parser')


pageNav = soup.find(class_= 'Normal')


pageSub = pageNav.find_all('p')


date = True

for strong_tag in soup.find_all('strong'):

    if date:

        print(strong_tag.text, strong_tag.next_sibling)

        date = False

    if strong_tag.text == "24 Hr. Change:" or strong_tag.text=="Yesterday's High:" or strong_tag.text=="Lake Surface Temperature:":

        print(strong_tag.text, strong_tag.next_sibling)


查看完整回答
反對 回復(fù) 2021-12-29
  • 1 回答
  • 0 關(guān)注
  • 207 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號