第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機(jī)立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

變量內(nèi)字符串之間的相關(guān)性

變量內(nèi)字符串之間的相關(guān)性

MMTTMM 2023-08-08 16:35:16
如何評估每個變量中每種類型之間的相關(guān)性?df      level            job0     good           golfer1     bad           footballer2   intermediate     musician...預(yù)期輸出是一個相關(guān)表或類似的東西:             golfer  footballer  musician  ...good      bad       intermediate 我試過:df['level']=df['level'].astype('category').cat.codesdf['job']=df['job'].astype('category').cat.codesdf.corr()
查看完整描述

2 回答

?
qq_遁去的一_1

TA貢獻(xiàn)1725條經(jīng)驗 獲得超8個贊

您可以使用pd.crosstab


df1 = pd.crosstab(df.level, df.job)

df1

對于我的示例數(shù)據(jù),您將得到輸出


job           footballer  golfer  musician

level

bad                    1       3         3

good                   3       3         2

intermediate           1       2         2

然后除以每行的總和


 df1 / df1.sum()

輸出


job           footballer  golfer  musician

level

bad                  0.2   0.375  0.428571

good                 0.6   0.375  0.285714

intermediate         0.2   0.250  0.285714


查看完整回答
反對 回復(fù) 2023-08-08
?
慕絲7291255

TA貢獻(xiàn)1859條經(jīng)驗 獲得超6個贊

從預(yù)期的輸出來看,您需要一個頻率表。我想這可以做得更好,但一種方法是:

count_combos = pd.Series(zip(df.level, df.job)).value_counts()
count_combos.index = pd.MultiIndex.from_tuples(count_combos.index)
count_combos.unstack()


查看完整回答
反對 回復(fù) 2023-08-08
  • 2 回答
  • 0 關(guān)注
  • 157 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號