首頁猿問 Pandas 系列...

Pandas 系列 value_counts 對(duì)不同計(jì)數(shù)的工作方式不同

Python

大話西游666 2021-08-17 15:48:48

例如：df1 = pd.DataFrame(np.repeat(np.arange(1,7),3), columns=['A'])df1.A.value_counts(sort=False)1 32 33 34 35 36 3Name: A, dtype: int64df2 = pd.DataFrame(np.repeat(np.arange(1,7),100), columns=['A'])df2.A.value_counts(sort=False)1 1002 1003 1004 1005 1006 100Name: A, dtype: int64在上面的例子中，value_counts工作完美并給出了所需的結(jié)果。而在處理更大的數(shù)據(jù)幀時(shí)，它會(huì)給出不同的輸出。這里的A值已經(jīng)排序并且計(jì)數(shù)也相同，但是索引的順序A在value_counts. 為什么它對(duì)小計(jì)數(shù)正確但對(duì)大計(jì)數(shù)不正確：df3 = pd.DataFrame(np.repeat(np.arange(1,7),1000), columns=['A'])df3.A.value_counts(sort=False)4 10001 10005 10002 10006 10003 1000Name: A, dtype: int64在這里我可以做df3.A.value_counts(sort=False).sort_index()或df3.A.value_counts(sort=False).reindex(df.A.unique())。我想知道為什么它對(duì)不同的計(jì)數(shù)表現(xiàn)不同？使用：Numpy version :1.15.2Pandas version :0.23.4

查看完整描述