首頁(yè) 猿問(wèn) 如何在 Pandas 合并中指定分層列？

如何在 Pandas 合并中指定分層列？

Python

MMMHUHU 2023-12-29 15:09:29

on在對(duì)in 的工作方式產(chǎn)生嚴(yán)重誤解之后join（劇透：與onin非常不同merge），這是我的示例代碼。import pandas as pdindex1 = pd.MultiIndex.from_product([["variables"], ["number", "fruit"]])df1 = pd.DataFrame([["one", "apple"], ["two", "banana"]], columns=index1)index2 = pd.MultiIndex.from_product([["variables"], ["fruit", "color"]])df2 = pd.DataFrame([["banana", "yellow"]], columns=index2)print(df1.merge(df2, on="fruit", how="left"))我得到一個(gè)KeyError. 我如何variables.fruit在這里正確引用？要理解我的目的，請(qǐng)考慮沒有多重索引的相同問(wèn)題：import pandas as pddf1 = pd.DataFrame([["one", "apple"], ["two", "banana"]], columns=["number", "fruit"])df2 = pd.DataFrame([["banana", "yellow"]], columns=["fruit", "color"])# this is obviously incorrect as it uses indexes on `df1` as well as `df2`:print(df1.join(df2, rsuffix="_"))# this is *also* incorrect, although I initially thought it should work, but it uses the index on `df2`:print(df1.join(df2, on="fruit", rsuffix="_"))# this is correct:print(df1.merge(df2, on="fruit", how="left"))預(yù)期和想要的結(jié)果是這樣的： number fruit color0 one apple NaN1 two banana yellowfruit當(dāng)是多重索引的一部分時(shí)，如何獲得相同的結(jié)果？

查看完整描述

1 回答

SMILET

TA貢獻(xiàn)1796條經(jīng)驗(yàn) 獲得超4個(gè)贊

我想我明白你現(xiàn)在想要實(shí)現(xiàn)的目標(biāo)，但我認(rèn)為這不會(huì)join讓你實(shí)現(xiàn)這一目標(biāo)。和DataFrame.join都DataFrame.merge可以調(diào)用pandas.core.reshape.merge.merge，但使用DataFrame.merge可以讓您更好地控制應(yīng)用的默認(rèn)值。

在您的情況下，您可以使用引用列來(lái)通過(guò)元組列表加入，其中元組的元素是多索引列的級(jí)別。即要使用variables / fruit列，可以通過(guò)[('variables', 'fruit')].

使用元組是索引多索引列（和行索引）的方式。您需要將其包裝在列表中，因?yàn)榭梢允褂枚鄠€(gè)列或多個(gè)多索引列來(lái)執(zhí)行合并操作，就像 SQL 中的 JOIN 語(yǔ)句一樣。傳遞單個(gè)字符串只是一個(gè)方便的情況，它會(huì)為您包裝在列表中。

由于您僅加入 1 列，因此它是單個(gè)元組的列表。

import pandas as pd

index1 = pd.MultiIndex.from_product([["variables"], ["number", "fruit"]])

df1 = pd.DataFrame([["one", "apple"], ["two", "banana"]], columns=index1)

index2 = pd.MultiIndex.from_product([["variables"], ["fruit", "color"]])

df2 = pd.DataFrame([["banana", "yellow"]], columns=index2)

df1.merge(df2, how='left', on=[('variables', 'fruit')])

# returns:

variables

number fruit color

0 one apple NaN

1 two banana yellow

反對(duì) 回復(fù) 2023-12-29

1 回答
0 關(guān)注
208 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

如何在 Pandas 合并中指定分層列？

如何在 Pandas 合并中指定分層列？

1 回答

添加回答

如何在 Pandas 合并中指定分層列？

如何在 Pandas 合并中指定分層列？