我有一個包含成員的組列表,而不是合并共享成員的組我需要保留分組并根據(jù)哪些組具有共同成員創(chuàng)建一組新的邊,并根據(jù)組的屬性有條件地這樣做源數(shù)據(jù)如下所示:+----------+------------+-----------+| Group ID | Group Type | Member ID |+----------+------------+-----------+| A? ? ? ? | Type 1? ? ?|? ? ? ? ?1 || A? ? ? ? | Type 1? ? ?|? ? ? ? ?2 || B? ? ? ? | Type 1? ? ?|? ? ? ? ?2 || B? ? ? ? | Type 1? ? ?|? ? ? ? ?3 || C? ? ? ? | Type 1? ? ?|? ? ? ? ?3 || C? ? ? ? | Type 1? ? ?|? ? ? ? ?4 || D? ? ? ? | Type 2? ? ?|? ? ? ? ?4 || D? ? ? ? | Type 2? ? ?|? ? ? ? ?5 |+----------+------------+-----------+期望的輸出是這樣的:+----------+-----------------+| Group ID | Linked Group ID |+----------+-----------------+| A? ? ? ? | B? ? ? ? ? ? ? ?|| B? ? ? ? | C? ? ? ? ? ? ? ?|+----------+-----------------+A 鏈接到 B 因為它共享 2 B 鏈接到 C 因為它共享 3 C 不鏈接到 D,它有一個共同的成員但屬于不同類型共享成員的數(shù)量對我來說并不重要,一個共同的成員意味著他們是鏈接的輸出被用作圖的邊,所以如果輸出是符合規(guī)則的圖,那很好源數(shù)據(jù)集很大(數(shù)億行),因此性能是一個考慮因素這提出了一個類似的問題,但是我是 Python 的新手,無法弄清楚如何將源數(shù)據(jù)獲取到可以使用答案的地步,或者在組類型匹配的附加要求中工作
1 回答

慕姐4208626
TA貢獻1852條經(jīng)驗 獲得超7個贊
嘗試這樣的事情-
df1=df.groupby(['Group Type','Member ID'])['Group ID'].apply(','.join).reset_index() df2=df1[df1['Group ID'].str.contains(",")]
這可能無法處理循環(huán)分組的情況。
添加回答
舉報
0/150
提交
取消