我接觸了一些需要在面向 Pandas 的處理中進行翻譯的 PySpark 代碼。任何幫助都會非常受歡迎,因為我正在努力尋找 Pandas 等價物的方法:PySpark代碼:window = Window.partitionBy(df["timestamp"]).orderBy(df["timestamp"].desc())df = df.select('*', F.rank().over(window).alias('rank')) \ .filter(F.col('rank') <= 1) \ .orderBy(df["timestamp"].desc()) \ .limit(int(window_int))謝謝
在 Pandas 中對 Window PartitionBy 進行排名
慕桂英3389331
2023-10-11 15:38:52