第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

使用 BeautifulSoup 從 <a href 標(biāo)簽中提取特定頁(yè)面鏈接

使用 BeautifulSoup 從 <a href 標(biāo)簽中提取特定頁(yè)面鏈接

尚方寶劍之說(shuō) 2021-08-14 17:11:13
我正在使用 BeautifulSoup 從此頁(yè)面中提取所有鏈接:http : //kern.humdrum.org/search?s=t&keyword=Haydn我通過(guò)這種方式獲得所有這些鏈接:# -*- coding: utf-8 -*-from urllib.request import urlopen as uReqfrom bs4 import BeautifulSoup as soupmy_url = 'http://kern.humdrum.org/search?s=t&keyword=Haydn'#opening up connecting, grabbing the pageuClient = uReq(my_url)# put all the content in a variablepage_html = uClient.read()#close the internet connectionuClient.close()#It does my HTML parserpage_soup = soup(page_html, "html.parser")# Grab all of the linkscontainers = page_soup.findAll('a', href=True)#print(type(containers))for container in containers:    link = container    #start_index = link.index('href="')     print(link)    print("---")    #print(start_index)我的部分輸出是:請(qǐng)注意,它返回了幾個(gè)鏈接,但我真的想要所有帶有 >Someting 的鏈接。(例如,“> Allegro”和“Allegro vivace”等等)。我很難獲得以下類(lèi)型的輸出(圖像示例):“快板 - http://kern.ccarh.org/cgi-bin/ksdata?location=users/craig/classical/beethoven/piano/奏鳴曲&文件=奏鳴曲01-1.krn&格式=信息“換句話(huà)說(shuō),在這一點(diǎn)上,我有一堆錨標(biāo)簽(+- 1000)。從所有這些標(biāo)簽中,有一堆只是“垃圾”和 +- 350 個(gè)我想提取的標(biāo)簽。所有這些標(biāo)簽看起來(lái)幾乎一樣,但唯一的區(qū)別是我需要的標(biāo)簽?zāi)┪灿幸粋€(gè)“>某人的名字<\a>”。我只想提取具有此特征的所有錨標(biāo)記的鏈接。
查看完整描述

3 回答

?
守著星空守著你

TA貢獻(xiàn)1799條經(jīng)驗(yàn) 獲得超8個(gè)贊

最好和最簡(jiǎn)單的方法是在打印鏈接時(shí)使用文本屬性。像這樣 : print link.text


查看完整回答
反對(duì) 回復(fù) 2021-08-14
  • 3 回答
  • 0 關(guān)注
  • 839 瀏覽
慕課專(zhuān)欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢(xún)優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)