首頁猿問 python中的itertools...

python中的itertools.groupby（）

Python

慕村225694 2021-03-30 13:09:51

我有元組。例如：set([(('E', ('T',)), 0), (('F', ('(', 'E', ')')), 0), (('T', ('F',)), 0), (('__S__', ('E', '$')), 0), (('E', ('E', '+', 'T')), 0), (('T', ('T', '*', 'F')), 0), (('F', ('id',)), 0)])如您所見，每個元組都有一個元組作為它的第一個元素（例如（'F'，（'（'，'E'，'）'）））。該元組的第一個元素是單個字符，第二個元素是另一個元組（例如（'（'，'E'，'）'）））。該元組中具有一個或多個單個字符。（實際上是上下文無關(guān)語法。第一個元素是rule（head）的LHS，第二個元組是RHS（body），每個元組的第二個元素中的數(shù)字是指向該語法RHS中字符之一的指針。我正在嘗試我要做的就是根據(jù)所指向的元素對元組進行分組，為此，我編寫了以下代碼：import itertoolsS = set([(('E', ('T',)), 0), (('F', ('(', 'E', ')')), 0), (('T', ('F',)), 0), (('__S__', ('E', '$')), 0), (('E', ('E', '+', 'T')), 0), (('T', ('T', '*', 'F')), 0), (('F', ('id',)), 0)])for v, h in itertools.groupby(S, lambda x: x[0][1][x[1]] if len(x[0][1]) > x[1] else None ): if (v is None): continue print '--' print v for hi in h: print hi如果x [0] [1] [x [1]]相同，則兩個元組在同一組中。x [0] [1]是第一個元組的第二個元組（語法的RHS），而x [1]是指針。我得到以下結(jié)果：--((('F', ('(', 'E', ')')), 0)--F(('T', ('F',)), 0)--E(('__S__', ('E', '$')), 0)--T(('T', ('T', '*', 'F')), 0)--id(('F', ('id',)), 0)--T(('E', ('T',)), 0)--E(('E', ('E', '+', 'T')), 0)如您所見，有兩個鍵為“ T”的組。我不明白我在做什么錯！我?guī)缀跏切碌膒ython程序員。萬一問題太愚蠢了！

查看完整描述

1 回答

白豬掌柜的

TA貢獻1893條經(jīng)驗獲得超10個贊

itertools.groupby()如果您希望按照文檔將所有類似數(shù)據(jù)分組，則需要對數(shù)據(jù)進行排序：

通常，可迭代項需要已經(jīng)在相同的鍵功能上進行了排序。

groupby（）的操作類似于Unix中的uniq過濾器。每當鍵函數(shù)的值更改時，它就會生成一個中斷或新組（這就是為什么通常需要使用相同的鍵函數(shù)對數(shù)據(jù)進行排序的原因）。這種行為與SQL的GROUP BY不同，后者的GROUP BY聚集公共元素，而不管它們的輸入順序如何。

只需先調(diào)用sorted()數(shù)據(jù)（將函數(shù)用作鍵函數(shù)），然后進行分組即可。

key_func = lambda x: x[0][1][x[1]] if len(x[0][1]) > x[1] else None

itertools.groupby(sorted(data, key=key_func), key_func)

反對回復(fù) 2021-04-02