首頁猿問如何從具有多級重復(fù)列的 excel...

如何從具有多級重復(fù)列的 excel 表中取消堆疊 df？設(shè)置多索引？

Python

素胚勾勒不出你 2023-06-13 16:03:34

df 從 xlsx 讀?。篸f = pd.read_excel('file.xlsx')像這樣到達(dá)：? ?Age Male Female Male.1 Female.10? NaN? Big? Small? Small? ? ? Big1? 1.0? ? 2? ? ? 3? ? ? 2? ? ? ? 32? 2.0? ? 3? ? ? 4? ? ? 3? ? ? ? 43? 3.0? ? 4? ? ? 5? ? ? 4? ? ? ? 5df = pd.DataFrame({'Age':[np.nan, 1,2,3],'Male':['Big',2,3,4],'Female':['Small',3,4,5],'Male.1':['Small',2,3,4],'Female.1':['Big',3,4,5]})注意 Pandas 為重復(fù)的列添加后綴.1，這是不希望的。我想拆開/融化以獲得這個(gè)或類似的東西：? ? Age Gender? Size? ? [measure]1? ?1? ?Male? ? Big? ? ?22? ?2? ?Male? ? Big? ? ?33? ?3? ?Male? ? Big? ? ?44? ?1? ?Female? Big? ? ?35? ?2? ?Female? Big? ? ?46? ?3? ?Female? Big? ? ?57? ?1? ?Male? ? Small? ?28? ?2? ?Male? ? Small? ?39? ?3? ?Male? ? Small? ?410? 1? ?Female? Small? ?311? 2? ?Female? Small? ?412? 3? ?Female? Small? ?5重命名列和取消堆疊接近但沒有雪茄：df= df.rename(columns={'Male.1': 'Male', 'Female.1':'Female'})df= df.set_index(['Age']).unstack()如何將第一行設(shè)置為列的第二個(gè)索引級別？

查看完整描述

3 回答

蕪湖不蕪

TA貢獻(xiàn)1796條經(jīng)驗(yàn) 獲得超7個(gè)贊

而不是.unstack()，另一種方法是.melt()。

您可以使用轉(zhuǎn)置數(shù)據(jù)框，并.T使用獲取第一行之后的所有內(nèi)容.iloc[1:]。然后，.rename列、.replace帶有.1一些正則表達(dá)式的.melt數(shù)據(jù)框和.sort_values.

df = pd.DataFrame({'Age':[np.nan, 1,2,3],'Male':['Big',2,3,4],'Female':['Small',3,4,5],'Male.1':['Small',2,3,4],'Female.1':['Big',3,4,5]})

df = (df.T.reset_index().iloc[1:]

.rename({'index' : 'Gender', 0 : 'Size'}, axis=1)

.replace(r'\.\d+$', '', regex=True)

.melt(id_vars=['Gender', 'Size'], value_name='[measure]', var_name='Age')

.sort_values(['Size', 'Gender', 'Age'], ascending=[True,False,True])

.reset_index(drop=True))

df = df[['Age', 'Gender', 'Size', '[measure]']]

df

Out[41]:

Age Gender Size [measure]

0 1 Male Big 2

1 2 Male Big 3

2 3 Male Big 4

3 1 Female Big 3

4 2 Female Big 4

5 3 Female Big 5

6 1 Male Small 2

7 2 Male Small 3

8 3 Male Small 4

9 1 Female Small 3

10 2 Female Small 4

11 3 Female Small 5

反對回復(fù) 2023-06-13

慕哥6287543

TA貢獻(xiàn)1831條經(jīng)驗(yàn) 獲得超10個(gè)贊

如果可能，創(chuàng)建前 2 行MultiIndex和第一列作為索引依據(jù)header和index_col參數(shù) in?read_excel：

df = pd.read_excel('file.xlsx',header=[0,1], index_col=[0])

? ??

print (df)

Age Male Female? Male Female

? ? ?Big? Small Small? ? Big

1.0? ? 2? ? ? 3? ? ?2? ? ? 3

2.0? ? 3? ? ? 4? ? ?3? ? ? 4

3.0? ? 4? ? ? 5? ? ?4? ? ? 5

print (df.columns)

MultiIndex([(? 'Male',? ?'Big'),

? ? ? ? ? ? ('Female', 'Small'),

? ? ? ? ? ? (? 'Male', 'Small'),

? ? ? ? ? ? ('Female',? ?'Big')],

? ? ? ? ? ?names=['Age', None])

print (df.index)

Float64Index([1.0, 2.0, 3.0], dtype='float64')

所以可能使用DataFrame.unstack：

df = (df.unstack()

? ? ? ? .rename_axis(['Gender', 'Size','Age'])

? ? ? ? .reset_index(name='measure'))

print (df)

? ? Gender? ?Size? Age? measure

0? ? ?Male? ? Big? 1.0? ? ? ? 2

1? ? ?Male? ? Big? 2.0? ? ? ? 3

2? ? ?Male? ? Big? 3.0? ? ? ? 4

3? ?Female? Small? 1.0? ? ? ? 3

4? ?Female? Small? 2.0? ? ? ? 4

5? ?Female? Small? 3.0? ? ? ? 5

6? ? ?Male? Small? 1.0? ? ? ? 2

7? ? ?Male? Small? 2.0? ? ? ? 3

8? ? ?Male? Small? 3.0? ? ? ? 4

9? ?Female? ? Big? 1.0? ? ? ? 3

10? Female? ? Big? 2.0? ? ? ? 4

11? Female? ? Big? 3.0? ? ? ? 5

如果不可能使用：

您可以創(chuàng)建MultiIndex和MultiIndex.from_arrays刪除最后一個(gè).數(shù)字 by?replace，然后過濾掉第一行DataFrame.iloc并按DataFrame.melt第一列重塑形狀，最后設(shè)置新的列名稱：

df.columns = pd.MultiIndex.from_arrays([df.columns.str.replace(r'\.\d+$', ''),?

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? df.iloc[0]])

df = df.iloc[1:].melt(df.columns[:1].tolist())

df.columns=['Age','Gender','Size','measure']

print (df)

? ? Age? Gender? ?Size measure

0? ?1.0? ? Male? ? Big? ? ? ?2

1? ?2.0? ? Male? ? Big? ? ? ?3

2? ?3.0? ? Male? ? Big? ? ? ?4

3? ?1.0? Female? Small? ? ? ?3

4? ?2.0? Female? Small? ? ? ?4

5? ?3.0? Female? Small? ? ? ?5

6? ?1.0? ? Male? Small? ? ? ?2

7? ?2.0? ? Male? Small? ? ? ?3

8? ?3.0? ? Male? Small? ? ? ?4

9? ?1.0? Female? ? Big? ? ? ?3

10? 2.0? Female? ? Big? ? ? ?4

11? 3.0? Female? ? Big? ? ? ?5

或者解決方案DataFrame.unstack是可能的，只將第一列設(shè)置為indexby并為新列名稱設(shè)置byDataFrame.set_index的級別：MultiIndexSeries.rename_axis

df.columns = pd.MultiIndex.from_arrays([df.columns.str.replace(r'\.\d+$', ''),?

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? df.iloc[0]])

df = (df.iloc[1:].set_index(df.columns[:1].tolist())

? ? ? ? .unstack()

? ? ? ? .rename_axis(['Gender', 'Size','Age'])

? ? ? ? .reset_index(name='measure'))

print (df)

? ? Gender? ?Size? Age measure

0? ? ?Male? ? Big? 1.0? ? ? ?2

1? ? ?Male? ? Big? 2.0? ? ? ?3

2? ? ?Male? ? Big? 3.0? ? ? ?4

3? ?Female? Small? 1.0? ? ? ?3

4? ?Female? Small? 2.0? ? ? ?4

5? ?Female? Small? 3.0? ? ? ?5

6? ? ?Male? Small? 1.0? ? ? ?2

7? ? ?Male? Small? 2.0? ? ? ?3

8? ? ?Male? Small? 3.0? ? ? ?4

9? ?Female? ? Big? 1.0? ? ? ?3

10? Female? ? Big? 2.0? ? ? ?4

11? Female? ? Big? 3.0? ? ? ?5

反對回復(fù) 2023-06-13

蠱毒傳說

TA貢獻(xiàn)1895條經(jīng)驗(yàn) 獲得超3個(gè)贊

通過將行 0 與列組合來創(chuàng)建多索引列：

df.columns = pd.MultiIndex.from_arrays((df.columns, df.iloc[0]))

df.columns.names = ['gender', 'size']

df.columns

MultiIndex([( 'Age', nan),

( 'Male', 'Big'),

( 'Female', 'Small'),

( 'Male.1', 'Small'),

('Female.1', 'Big')],

names=['gender', 'size'])

現(xiàn)在您可以重塑和重命名：

(df

.dropna()

.melt([('Age', np.NaN)], value_name='measure')

.replace(r'\.\d+$', '', regex=True)

.rename(columns={("Age", np.NaN) : "Age"}))

Age gender size measure

0 1.0 Male Big 2

1 2.0 Male Big 3

2 3.0 Male Big 4

3 1.0 Female Small 3

4 2.0 Female Small 4

5 3.0 Female Small 5

6 1.0 Male Small 2

7 2.0 Male Small 3

8 3.0 Male Small 4

9 1.0 Female Big 3

10 2.0 Female Big 4

11 3.0 Female Big 5

反對回復(fù) 2023-06-13

3 回答
0 關(guān)注
212 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

如何從具有多級重復(fù)列的 excel 表中取消堆疊 df？設(shè)置多索引？

如何從具有多級重復(fù)列的 excel 表中取消堆疊 df？設(shè)置多索引？

3 回答

添加回答

如何從具有多級重復(fù)列的 excel 表中取消堆疊 df？設(shè)置多索引？

如何從具有多級重復(fù)列的 excel 表中取消堆疊 df？設(shè)置多索引？