最新回答 / superplayer
兩個問題,一個是需要導(dǎo)入re模塊;import re;另外一個是 如果用的是python3的話 ?print需要加括號,修改成print(m2)
2018-04-22
已采納回答 / 慕尼黑7825836
正則表達(dá)式在進(jìn)行數(shù)量匹配時有{},+,*,?其中.*代表匹配除換行符以外的任意字符任意次,可以是0次。.代表除換行符以外的任意字符,*代表任意次,相當(dāng)于{0,} 后邊多一個?表示懶惰模式。必須跟在*或者+后邊用.*??是懶惰匹配,一旦匹配到第一個就不往下走了。.*+是無限匹配直到最后一個。
2018-04-19
已采納回答 / 芳芳菲菲
可以在req = urllib2.urlopen('http:'+url)上面 print 'http:'+url, 就會發(fā)現(xiàn)問題所在。listurl = re.findall(r'//.+\.jpg*',buf)這個地方的正則錯誤,應(yīng)該使用非貪婪匹配模式,改為listurl = re.findall(r'//.+?\.jpg',buf),即可。
2018-03-16
最新回答 / 芳芳菲菲
因為后邊的字符串'<book>'不滿足前面的前面的正則要求,重點(diǎn)是弄明白\1是什么意思??梢宰鰞蓚€測試:測試1:pa = re.match(r'<([\w]+>)\1', '<book>book>')pa.groups()測試2:pa = re.match(r'<([\w]+>)', '<book>')pa.groups()
2018-03-09
已采納回答 / 慕尼黑8959533
listurl = re.sub(r'src="','http:',str(listurl))的這一步結(jié)果是一個str,還需要再將地址匹配出來,多寫一步:listurl = re.findall(r'http:.+?\.jpg'),這樣得到的結(jié)果是list
2018-02-03
最新回答 / qq_鑫_4
values = re.findall(r"src.*? ",?res)values = [t[len("src="):len(t) - 1] for t in values]
2018-01-24
最贊回答 / 慕勒0288754
有免費(fèi)版的啊 并且區(qū)別不大? 學(xué)習(xí)一門語言而已沒有必要搞到Linux上,會給新手帶來負(fù)擔(dān)? 個人觀點(diǎn)哈
2018-01-23
最贊回答 / 華燈初上丶
import reimport urllibreq = urllib.request.urlopen('http://idcbgp.cn/course/list')#此處加上decode(),不然拿下來的數(shù)據(jù)都是亂碼buf = req.read().decode("utf-8")#老師講課的url地址已經(jīng)發(fā)生改變,改一下正則匹配就好# listurl = re.findall(r'src=.+\.jpg', buf)listurl = re.findall(r'//img.+?\.jpg', bu...
2018-01-21