第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

如何在 Pandas 合并中指定分層列?

如何在 Pandas 合并中指定分層列?

MMMHUHU 2023-12-29 15:09:29
on在對(duì)in 的工作方式產(chǎn)生嚴(yán)重誤解之后join(劇透:與onin非常不同merge),這是我的示例代碼。import pandas as pdindex1 = pd.MultiIndex.from_product([["variables"], ["number", "fruit"]])df1 = pd.DataFrame([["one", "apple"], ["two", "banana"]], columns=index1)index2 = pd.MultiIndex.from_product([["variables"], ["fruit", "color"]])df2 = pd.DataFrame([["banana", "yellow"]], columns=index2)print(df1.merge(df2, on="fruit", how="left"))我得到一個(gè)KeyError. 我如何variables.fruit在這里正確引用?要理解我的目的,請(qǐng)考慮沒有多重索引的相同問題:import pandas as pddf1 = pd.DataFrame([["one", "apple"], ["two", "banana"]], columns=["number", "fruit"])df2 = pd.DataFrame([["banana", "yellow"]], columns=["fruit", "color"])# this is obviously incorrect as it uses indexes on `df1` as well as `df2`:print(df1.join(df2, rsuffix="_"))# this is *also* incorrect, although I initially thought it should work, but it uses the index on `df2`:print(df1.join(df2, on="fruit", rsuffix="_"))# this is correct:print(df1.merge(df2, on="fruit", how="left"))預(yù)期和想要的結(jié)果是這樣的:  number   fruit   color0    one   apple     NaN1    two  banana  yellowfruit當(dāng)是多重索引的一部分時(shí),如何獲得相同的結(jié)果?
查看完整描述

1 回答

?
SMILET

TA貢獻(xiàn)1796條經(jīng)驗(yàn) 獲得超4個(gè)贊

我想我明白你現(xiàn)在想要實(shí)現(xiàn)的目標(biāo),但我認(rèn)為這不會(huì)join讓你實(shí)現(xiàn)這一目標(biāo)。和DataFrame.join都DataFrame.merge可以調(diào)用pandas.core.reshape.merge.merge,但使用DataFrame.merge可以讓您更好地控制應(yīng)用的默認(rèn)值。


在您的情況下,您可以使用引用列來通過元組列表加入,其中元組的元素是多索引列的級(jí)別。即要使用variables / fruit列,可以通過[('variables', 'fruit')].


使用元組是索引多索引列(和行索引)的方式。您需要將其包裝在列表中,因?yàn)榭梢允褂枚鄠€(gè)列或多個(gè)多索引列來執(zhí)行合并操作,就像 SQL 中的 JOIN 語句一樣。傳遞單個(gè)字符串只是一個(gè)方便的情況,它會(huì)為您包裝在列表中。


由于您僅加入 1 列,因此它是單個(gè)元組的列表。


import pandas as pd


index1 = pd.MultiIndex.from_product([["variables"], ["number", "fruit"]])

df1 = pd.DataFrame([["one", "apple"], ["two", "banana"]], columns=index1)


index2 = pd.MultiIndex.from_product([["variables"], ["fruit", "color"]])

df2 = pd.DataFrame([["banana", "yellow"]], columns=index2)


df1.merge(df2, how='left', on=[('variables', 'fruit')])

# returns:

  variables

     number   fruit   color

0       one   apple     NaN

1       two  banana  yellow


查看完整回答
反對(duì) 回復(fù) 2023-12-29
  • 1 回答
  • 0 關(guān)注
  • 181 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)