首頁猿問在Scrapy中抓取元素之間的文本

在Scrapy中抓取元素之間的文本

Python

米脂 2023-10-06 19:18:48

我正在使用 Scrapy，我正在嘗試抓取這樣的內(nèi)容：<html> <div class='hello'> some elements . . . </div> <div class='hi there'> <div> <h3> title </h3> <h4> another title </h4> <p> some text ..... </p> "some text without any tag" <div class='article'> some elements . . </div> <div class='article'> some elements . . </div> <div class='article'> some elements . . </div> </div> </div></html>如果我想從類名“hi There”的 div 下以及類名“article”的 div 之前的所有元素中提取文本，是否有任何可能的方法使用 XPath 或 CSS 選擇器進(jìn)行枯萎？

查看完整描述

1 回答

倚天杖

TA貢獻(xiàn)1828條經(jīng)驗(yàn) 獲得超3個(gè)贊

沒用過Scrapy。

不知道它有什么功能，但是

//div[@class='hi there']/div/(div[@class='article'])[1]/preceding-sibling::*

挑選出 div 之前具有“article”類的元素，并且，

//div[@class='hi there']/div/(div[@class='article'])[1]/preceding-sibling::text()

在文章 div 之前為您提供內(nèi)部文本。

反對回復(fù) 2023-10-06

1 回答
0 關(guān)注
98 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

在Scrapy中抓取元素之間的文本

在Scrapy中抓取元素之間的文本

1 回答

添加回答