網(wǎng)絡(luò)抓取新手,我使用 scrapy 和 python 從特定網(wǎng)站獲取所有類別。包含網(wǎng)絡(luò)源(網(wǎng)絡(luò)源圖片),我一直在嘗試的代碼如下。我試圖隔離類別,這些類別位于“dropdown-submenu”類中每個(gè)項(xiàng)目的 href="/categories#" 之后。我試過了 category_urls = response.css("categories").xpath("@href").extract()category_urls = response.css(".link-list-columns").xpath("@href").extract()但我不斷收到空列。感謝您提供的任何幫助,謝謝!
1 回答

MYYA
TA貢獻(xiàn)1868條經(jīng)驗(yàn) 獲得超4個(gè)贊
我看不到任何名為“類別”的元素,也沒有看到名為“鏈接列表列”的類,因此我不確定該圖像是否真的是您正在抓取的頁面。(順便說一句,下次請(qǐng)不要發(fā)布圖片,要么鏈接頁面,要么復(fù)制并粘貼問題中的代碼)
假設(shè)打印正確,您可以嘗試:
response.xpath('//li[@class="dropdown-submenu"]/a/@href').getall()
或者等效的 css
response.css('li.dropdown-submenu a::attr(href)').getall()
添加回答
舉報(bào)
0/150
提交
取消