第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

beautifulsoup 怎樣抓取 select 標(biāo)簽里面的 option 的文本?

beautifulsoup 怎樣抓取 select 標(biāo)簽里面的 option 的文本?

繁星coding 2019-04-09 20:23:21
我要抓取的頁(yè)面的內(nèi)容是在如下標(biāo)簽內(nèi)的parent.theZNPKT_CJJS1.innerHTML='[0000789]Andrew';我寫(xiě)的代碼:importurllib2frombs4importBeautifulSoupurl='xxx'html=urllib2.urlopen(url)soup=BeautifulSoup(html,from_encoding='gbk')option=soup.findAll('option')f=open("out.txt","w")print>>f,optionf.close()printoption抓取出來(lái)的結(jié)果全都是[0000049]ANNA這樣的,我想提取[0000049]ANNA這個(gè)內(nèi)容怎樣做呀?很多東西都不懂,經(jīng)過(guò)搜索換了一種方法提取出來(lái)了。用的是正則的方法:importurllib2importreurl='xxx'html=urllib2.urlopen(url).read()patt=re.compile(r'(.+?)')option=patt.findall(html)f=open("out.txt","w")forvalueinoption:printvaluef.writelines(value+'\n')f.close()
查看完整描述

2 回答

?
萬(wàn)千封印

TA貢獻(xiàn)1891條經(jīng)驗(yàn) 獲得超3個(gè)贊

1.你要抓取的option等內(nèi)容,很明顯,是標(biāo)簽script內(nèi)部的內(nèi)容(content/text)
-》所以沒(méi)法用BeautifulSoup當(dāng)做標(biāo)簽(的屬性)去抓取
2.想要當(dāng)做屬性處理
一種辦法:
在獲得你所說(shuō)的:
[0000049]ANNA
后,再去把(用html標(biāo)簽括起來(lái))組合成html,然后再用BeautifulSoup去當(dāng)做html處理
->就可以獲得option這個(gè)標(biāo)簽了
->就可以獲得option的string了
3.當(dāng)然,對(duì)于你這樣的情況,相對(duì)來(lái)說(shuō),用(你已經(jīng)用了的)正則,比用bs,效率更高。
4.關(guān)于beautifulSoup,可參考:
Python專題教程:BeautifulSoup詳解
                            
查看完整回答
反對(duì) 回復(fù) 2019-04-09
?
Qyouu

TA貢獻(xiàn)1786條經(jīng)驗(yàn) 獲得超11個(gè)贊

option也是個(gè)元素,不是屬性,你是不是應(yīng)該寫(xiě)為soup.findAll('selectoption')呢?
我太久沒(méi)有用BeautifulSoup了,具體的不記得怎么寫(xiě)。
                            
查看完整回答
反對(duì) 回復(fù) 2019-04-09
  • 2 回答
  • 0 關(guān)注
  • 2543 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)