這應(yīng)該很簡(jiǎn)單,但我是使用 python 工作的新手。有什么建議嗎?#original dataframedf = pd.DataFrame({'year':[1,1,1,1,1], 'month':[4,4,4,4,4], 'mode': ['a','b','a','a','b']}, columns=['year','month','mode'])#pivot/groupby etc# df2=df.pivot(columns=('year','month'), values=('mode')).count()#create this dataframedf2 = pd.DataFrame({'year':[1], 'month':[4], 'a': [3], 'b':[2]}, columns=['year','month','a','b'])我在 Koalas Apache Spark 環(huán)境中工作(文檔),所以解決方案應(yīng)該可以解決這個(gè)問(wèn)題。
2 回答

回首憶惘然
TA貢獻(xiàn)1847條經(jīng)驗(yàn) 獲得超11個(gè)贊
df.pivot_table(index=['year','month'], aggfunc='size', columns='mode')

楊魅力
TA貢獻(xiàn)1811條經(jīng)驗(yàn) 獲得超6個(gè)贊
或者你可以使用pd.get_dummies():
pd.get_dummies(df).groupby(['year','month']).sum()
結(jié)果:
mode_a mode_b
year month
1 4 3 2
注意:我不確定它是否適用于 Koalas Apache Spark 環(huán)境。
添加回答
舉報(bào)
0/150
提交
取消