第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

Scrapy正則表達(dá)式怎么去掉空格和換行符?

Scrapy正則表達(dá)式怎么去掉空格和換行符?

開滿天機(jī) 2019-02-20 12:13:08
HTML: <html> <head> <base /> <title>Example website</title> </head> <body> <div id='demo'> <div> &nbsp;&nbsp;&nbsp;&nbsp;美國(guó)國(guó)家航空航天局(NASA)與英國(guó)著名物理學(xué)家霍金攜手,將共同打造微型星際飛船“納米飛行器”。\r\n該飛行器將以五分之一光速飛行,并用<span>20</span>年時(shí)間飛到距太陽(yáng)系最近的恒星之一比鄰星,幫助人類盡早找到下一個(gè)適合居住的星體。 </div> </div> </body> </html> 獲取整段文字可以這樣寫: In:response.xpath('string(//div[@id="demo"]/div)').extract_first() Out: u'\r\n\t\t\t\t????美國(guó)國(guó)家航空航天局(NASA)與英國(guó)著名物理學(xué)家霍金攜手,將共同打造微型星際飛船“納米飛行器”。\r\n該飛行器將以五分之一光速飛行,并用20年時(shí)間飛到距太陽(yáng)系最近的恒星之一比鄰星,幫助人類盡早找到下一個(gè)適合居住的星體。' 我想把輸出結(jié)果里面的空格和換行符去掉,后面加一個(gè)re()函數(shù): In:response.xpath('//div[@id="demo"]/div/text()').re(r'') 問(wèn)題:上面re()函數(shù)中的正則表達(dá)式該怎么寫?
查看完整描述

2 回答

?
米脂

TA貢獻(xiàn)1836條經(jīng)驗(yàn) 獲得超3個(gè)贊

可以用re.sub 函數(shù)進(jìn)行以正則替換,
sub(pattern, repl, string, count=0)

  • 第一個(gè)參數(shù):規(guī)則

  • 第二個(gè)參數(shù):替換后的字符串

  • 第三個(gè)參數(shù):字符串

  • 第四個(gè)參數(shù):替換個(gè)數(shù)。默認(rèn)為0,表示每個(gè)匹配項(xiàng)都替換

>>> a="\t\t\n 123"
>>> a
'\t\t\n 123'
>>> b = re.sub(r'\s+','', a) #\s   匹配任意的空白符
>>> b
'123'
查看完整回答
反對(duì) 回復(fù) 2019-03-04
?
翻翻過(guò)去那場(chǎng)雪

TA貢獻(xiàn)2065條經(jīng)驗(yàn) 獲得超14個(gè)贊

.re(r'S+')

注意是大寫的S

s -- (小寫 s) 匹配單個(gè)空白字符 -- 空格,換行,返回,tab 形式為[ nrtf]. S (大寫 S) 匹配任意的非空白字符的字符

查看完整回答
反對(duì) 回復(fù) 2019-03-04
  • 2 回答
  • 0 關(guān)注
  • 1785 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)