第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何將網(wǎng)頁抓取的數(shù)據(jù)添加到 Python 中的集合

如何將網(wǎng)頁抓取的數(shù)據(jù)添加到 Python 中的集合

尚方寶劍之說 2021-10-05 16:22:54
我正在嘗試從網(wǎng)站上抓取 URL 并使用一組將它們發(fā)送到 .CSV 文件,以便刪除重復(fù)的 URL。我了解集合是什么以及如何創(chuàng)建集合,我只是不明白如何將網(wǎng)絡(luò)抓取的數(shù)據(jù)發(fā)送到集合。我假設(shè)它在 for 循環(huán)中,但我是 Python 新手并且不太確定。這是我的代碼的尾端:url_list=soup.find_all('a')with open('HTMLList.csv','w',newline="") as f:    writer=csv.writer(f,delimiter=' ',lineterminator='\r')    for link in url_list:        url=str(link.get('href'))        if url:            if 'https://www.example.com' not in url:                url = 'https://www.example.com' + url            writer.writerow([url])f.close()我知道我需要創(chuàng)建一個 set() 并將 URL 添加到該集合中,但我不確定如何并且我被告知它也將刪除任何重復(fù)項,這會很棒。任何幫助將非常感激。謝謝!
查看完整描述

1 回答

  • 1 回答
  • 0 關(guān)注
  • 199 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號