首頁猿問 Pandas-創(chuàng)建差異矩陣的數(shù)量

Pandas-創(chuàng)建差異矩陣的數(shù)量

Python

皈依舞 2023-03-22 10:51:11

我有這樣的數(shù)據(jù)框 L1 L2 L3 L4 L5A 1 2 3 4 5B 1 2 4 3 5C 1 3 3 2 1我想計算行之間的差異數(shù)，例如A和B之間的差異數(shù)是2，A和C是3，B和C是4。我真正想要的是一個差異矩陣，例如 A B CA 0 2 3B 2 0 4C 3 4 0

查看完整描述

1 回答

MMMHUHU

TA貢獻1834條經(jīng)驗獲得超8個贊

第一個循環(huán)解決方案是迭代每一行，通過 DataFrame 進行比較sum：

df = df.apply(lambda x: df.ne(x).sum(axis=1), axis=1)

print (df)

A B C

A 0 2 3

B 2 0 4

C 3 4 0

或者為了提高性能，將 numpy 中的值與 3d 數(shù)組的廣播進行比較，sum 和 last 使用 DataFrame 構造函數(shù)：

a = df.to_numpy()

out = pd.DataFrame((a != a[:, None]).sum(2), index=df.index, columns=df.index)

print (out)

A B C

A 0 2 3

B 2 0 4

C 3 4 0

np.random.seed(123)

df = pd.DataFrame( np.random.randint(20, size=(100, 500)))

print (df)

In [119]: %%timeit

...: df.apply(lambda x: df.ne(x).sum(axis=1), axis=1)

...:

12.8 s ± 1.02 s per loop (mean ± std. dev. of 7 runs, 1 loop each)

In [120]: %%timeit

...: a = df.to_numpy()

...: pd.DataFrame((a != a[:, None]).sum(2), index=df.index, columns=df.index)

...:

14.6 ms ± 325 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)

反對回復 2023-03-22

1 回答
0 關注
112 瀏覽

關注

添加回答

舉報

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

Pandas-創(chuàng)建差異矩陣的數(shù)量

Pandas-創(chuàng)建差異矩陣的數(shù)量

1 回答

添加回答