我已按照以下格式輸入數(shù)據(jù),但并非由我決定key1: value1 key2: value2 key3: value3 key4 { key11: val11 key22: value22 } key5: value5 ............輸入字符串將具有用冒號(hào)或大括號(hào)括起來的鍵值。我想對(duì)它進(jìn)行標(biāo)記化,我有以下想法:首先要有一個(gè)正則表達(dá)式來解析數(shù)據(jù),直到找到a:或{優(yōu)先于{over為止。:然后拆分并讀取,直到達(dá)到我說的空白模式,然后遞歸遍歷整個(gè)字符串我想知道是否可以編寫正則表達(dá)式,例如(some_string)(特殊字符模式)(特殊字符模式可以是:或{優(yōu)先于{)(字符串的其余部分)如果它是a,:那么對(duì)于其余的字符串,請(qǐng)從“ value1”中獲取字符串部分并捕獲它。處理剩余的字符串如果是{遍歷,直到找到}并內(nèi)部使用:上面定義的邏輯。例如a: 1 b: 2 c { d: 3 e: 4 } f: 5這應(yīng)該給a:1b:2c { d: 3 e: 4 }f: 5
1 回答

慕仙森
TA貢獻(xiàn)1827條經(jīng)驗(yàn) 獲得超8個(gè)贊
您可以使用以下模式:
[^ ]+(?:: [^ ]+| \{[^}]+\})
例子:
import re
test = "a: 1 b: 2 c { d: 3 e: 4 } f: 5"
pattern = re.compile(r"[^ ]+(?:: [^ ]+| \{[^}]+\})")
for match in pattern.findall(test):
print match
添加回答
舉報(bào)
0/150
提交
取消