第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機(jī)立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Scrapy 沒有得到完整的產(chǎn)品名稱,用逗號替換一些字符?

Scrapy 沒有得到完整的產(chǎn)品名稱,用逗號替換一些字符?

慕碼人2483693 2023-02-22 15:52:26
我正在使用 scrapy 在中國電子商務(wù)網(wǎng)站天貓上獲取產(chǎn)品名稱和價(jià)格。代碼非常簡單,但是當(dāng)它抓取名稱時,它用逗號替換了產(chǎn)品名稱的某些部分。對于下面的示例,我輸入了“ipad air 3”,第一個產(chǎn)品的名稱是“Apple/蘋果 10.5 英寸 iPad Air”?!?0.5英寸iPad Air”部分顯示顏色不同,我想是因?yàn)樗c搜索關(guān)鍵字相匹配。但我不確定為什么 scrapy 在產(chǎn)品名稱的那部分得到“,,,,”。有誰知道我可以嘗試修復(fù)它的潛在方法?綜上所述,我想要得到的結(jié)果是“Apple/蘋果 10.5英寸 iPad air”;然而,我得到的結(jié)果是“Apple/蘋果'、''、''、''、'”。這是屏幕截圖: 我得到的網(wǎng)頁結(jié)果items = TmallspiderItem()product_info = response.css('.product-iWrap')for product in product_info:    product_name = product.css('.productTitle a::text').extract()    product_price = product.css('.productPrice em::text').extract()    items['product_name'] = product_name    items['product_price'] = product_price    yield items
查看完整描述

1 回答

?
慕雪6442864

TA貢獻(xiàn)1812條經(jīng)驗(yàn) 獲得超5個贊

<a href="//detail.tmall.com/item.htm?id=612529092115&amp;skuId=4486436443940&amp;standard=1&amp;user_id=2202421911399&amp;cat_id=2&amp;is_b=1&amp;rn=c9a973f4c51d2bf839339810354ff07a" target="_blank" title="Apple/蘋果 Apple/蘋果 10.5 英寸 iPad Air" data-p="8-11" >

Apple/蘋果 Apple/蘋果 <span class=H>10.5</span> <span class=H>英寸</span> <span class=H>iPad</span> <span class=H>Air</span>

</a>

如您所見,您嘗試獲取的名稱被拆分為多個span元素。

您的 css 選擇器僅選擇作為a元素的直接子元素的文本節(jié)點(diǎn),因此它不會獲取這些元素的內(nèi)容。


您可以修改選擇器以獲取所有后代并加入它們,但我建議改用normalize-space()xpath 函數(shù)。


>>> product.css('.productTitle a::text').extract()

['\nApple/蘋果 ', ' ', ' ', ' ', '\n']

>>> product.css('.productTitle a ::text').extract()

['\nApple/蘋果 ', '10.5', ' ', '英寸', ' ', 'iPad', ' ', 'Air', '\n']

>>> product.css('.productTitle a').xpath('normalize-space()').get()

'Apple/蘋果 10.5 英寸 iPad Air'


查看完整回答
反對 回復(fù) 2023-02-22
  • 1 回答
  • 0 關(guān)注
  • 72 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號