我有元組。例如:set([(('E', ('T',)), 0), (('F', ('(', 'E', ')')), 0), (('T', ('F',)), 0), (('__S__', ('E', '$')), 0), (('E', ('E', '+', 'T')), 0), (('T', ('T', '*', 'F')), 0), (('F', ('id',)), 0)])如您所見,每個元組都有一個元組作為它的第一個元素(例如('F',('(','E',')')))。該元組的第一個元素是單個字符,第二個元素是另一個元組(例如('(','E',')')))。該元組中具有一個或多個單個字符。(實際上是上下文無關(guān)語法。第一個元素是rule(head)的LHS,第二個元組是RHS(body),每個元組的第二個元素中的數(shù)字是指向該語法RHS中字符之一的指針。我正在嘗試我要做的就是根據(jù)所指向的元素對元組進行分組,為此,我編寫了以下代碼:import itertoolsS = set([(('E', ('T',)), 0), (('F', ('(', 'E', ')')), 0), (('T', ('F',)), 0), (('__S__', ('E', '$')), 0), (('E', ('E', '+', 'T')), 0), (('T', ('T', '*', 'F')), 0), (('F', ('id',)), 0)])for v, h in itertools.groupby(S, lambda x: x[0][1][x[1]] if len(x[0][1]) > x[1] else None ): if (v is None): continue print '--' print v for hi in h: print hi如果x [0] [1] [x [1]]相同,則兩個元組在同一組中。x [0] [1]是第一個元組的第二個元組(語法的RHS),而x [1]是指針。我得到以下結(jié)果:--((('F', ('(', 'E', ')')), 0)--F(('T', ('F',)), 0)--E(('__S__', ('E', '$')), 0)--T(('T', ('T', '*', 'F')), 0)--id(('F', ('id',)), 0)--T(('E', ('T',)), 0)--E(('E', ('E', '+', 'T')), 0)如您所見,有兩個鍵為“ T”的組。我不明白我在做什么錯!我?guī)缀跏切碌膒ython程序員。萬一問題太愚蠢了!
1 回答

白豬掌柜的
TA貢獻1893條經(jīng)驗 獲得超10個贊
itertools.groupby()如果您希望按照文檔將所有類似數(shù)據(jù)分組,則需要對數(shù)據(jù)進行排序:
通常,可迭代項需要已經(jīng)在相同的鍵功能上進行了排序。
groupby()的操作類似于Unix中的uniq過濾器。每當鍵函數(shù)的值更改時,它就會生成一個中斷或新組(這就是為什么通常需要使用相同的鍵函數(shù)對數(shù)據(jù)進行排序的原因)。這種行為與SQL的GROUP BY不同,后者的GROUP BY聚集公共元素,而不管它們的輸入順序如何。
只需先調(diào)用sorted()數(shù)據(jù)(將函數(shù)用作鍵函數(shù)),然后進行分組即可。
key_func = lambda x: x[0][1][x[1]] if len(x[0][1]) > x[1] else None
itertools.groupby(sorted(data, key=key_func), key_func)
添加回答
舉報
0/150
提交
取消