我有兩個(gè) numpy 數(shù)組X和GX(分別為 float 和 int),我想對(duì)X數(shù)組進(jìn)行 bin(以及相應(yīng)GX的值來(lái)保存頻率)并繪制一個(gè)直方圖,x 軸上有 bin,y 軸上有頻率。我也嘗試過(guò)使用 pandas'qcut和cutmatplotlib's histogram。它們似乎都不起作用。我從頭開始用 numpy 創(chuàng)建了 bin 和頻率,但我所能得到的只是一個(gè)散點(diǎn)圖。bins = np.linspace(min(X), max(X),100)freq = []countl = 0for i in range(len(bins)-1): count = 0 for j in range(len(X)): if bins[i]<X[j]<bins[i+1]: count += np.sum(GX[np.where(X==X[j])]) freq.append(count)for j in X: if bins[-2]<j<bins[-1]: countl += np.sum(GX[np.where(X==j)])freq.append(countl)plt.figure(figsize=(7,7))plt.scatter(bins,freq,c='b')而不是散點(diǎn)圖,我怎樣才能得到條形圖或直方圖(可能是一種更好的 bin 值方法)?
1 回答

慕絲7291255
TA貢獻(xiàn)1859條經(jīng)驗(yàn) 獲得超6個(gè)贊
使用給定的代碼,因?yàn)槟呀?jīng)計(jì)算了每個(gè)箱子,所以直方圖只是這些箱子的條形圖:
plt.bar(bins, freq, width=bins[1]-bins[0], color='crimson', ec='black')
請(qǐng)注意,該測(cè)試bins[i] < X[j] < bins[i+1]
會(huì)遺漏完全等于 bin 邊界的 X 值。在大多數(shù)情況下,這種平等是不太可能的,除了 X 的最小值和最大值。因此,bins[i] <= X[j] < bins[i+1]
會(huì)更安全。此外,為了適應(yīng)最后一個(gè)值,您可以僅使用一個(gè) epsilon 來(lái)擴(kuò)展 bin:例如bins = np.linspace(min(X), max(X)+0.000001, 100)
(取決于 X 的大小,確保 epsilon 非常小,但在smaller than
測(cè)試中不會(huì)被忽略)。
或者,如果 GX 的總和不會(huì)太大而不會(huì)導(dǎo)致內(nèi)存問(wèn)題,您可以只使用np.repeat
重復(fù)X
數(shù)組GX
作為重復(fù)因子。然后,matplotlib 可以按照通常的方式計(jì)算直方圖:
all_X = np.repeat(X, GX) plt.hist(all_X, bins=100, color='crimson', ec='black')
添加回答
舉報(bào)
0/150
提交
取消