3 回答

TA貢獻(xiàn)1946條經(jīng)驗(yàn) 獲得超4個贊
如果 score_list 中的所有值都采用以下格式:
344 位 (186),預(yù)期 = 5e-91
這個答案不是最漂亮的,但它也將值轉(zhuǎn)換為整數(shù),因?yàn)槟赡芟胗盟鳛樯镄畔W(xué)數(shù)據(jù)進(jìn)行分析。
import re
# This is your code
score_list = []
for record in blast_file:
score = re.search(r'Score = (.+\d)', record).group(1)
score_list.append(score)
print(score_list)
# This will extract the bit score
new_list = []
for i in score_list:
new_list.append(re.findall(r'^\d*', i))
new_list = [i for val in new_list for i in val]
new_list = list(map(int, new_list))
new_list
^\d* 將匹配任意數(shù)量的數(shù)字,直到“位”之前的空格。然后接下來的兩行將列表的列表展平并將所有數(shù)字從字符串轉(zhuǎn)換為整數(shù)。

TA貢獻(xiàn)1859條經(jīng)驗(yàn) 獲得超6個贊
下面是你可以獲得任何字符串的方法,只需像我一樣插入正則表達(dá)式。
def new():
string="Score = 344 bits (186), Expect = 5e-91"
n=re.search("= (.*?)\ bits",string)
m=n.group(1)
return str(m)

TA貢獻(xiàn)1828條經(jīng)驗(yàn) 獲得超3個贊
使用當(dāng)前的正則表達(dá)式,您將匹配所有字符直到最后一位,然后包括最后一位。
如果您只想匹配數(shù)字,請從 更改Score = (.+\d)
為Score = (\d+)
。
另外,請注意等式符號后有雙空格。如果你想忽略間距,這將是你的正則表達(dá)式:Score\s*=\s*(.+\d)
添加回答
舉報