我正在使用正則表達式從網(wǎng)站上編譯價格。PriceFinder = re.compile('(?<=\n\s\<b>\$)(\d*\.\d{2})(?=\<\/)|(?<=\"FF0000"><b>\$)(\d*\.\d{2})(?=\<\/)')Price = re.findall(PriceFinder, str(soup))print Price我得到以下結果:[('', '30.99'), ('', '30.99'), ('', '30.99'), ('34.99', ''), ('34.99', '')我想知道我必須添加到我的正則表達式中才能獲得沒有任何空元素的列表。['30.99','30.99','30.99','34.99','34.99']謝謝
1 回答

Qyouu
TA貢獻1786條經驗 獲得超11個贊
好的,我已經寫了我的第一個python來回答這個問題:
#!/usr/bin/python
import re
r = re.compile('(?:\n\s\<b>\$|\"FF0000"><b>\$)(\d*\.\d{2})(?=\<\/)')
p = re.findall(r, '<x y="FF0000"><b>$30.99</b></x>\n <b>$31.99</b>')
print p
打印出來 ['30.99', '31.99']
添加回答
舉報
0/150
提交
取消