第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

在有或沒(méi)有樞軸的情況下展平長(zhǎng)數(shù)據(jù)框的最佳方法

在有或沒(méi)有樞軸的情況下展平長(zhǎng)數(shù)據(jù)框的最佳方法

三國(guó)紛爭(zhēng) 2024-01-16 15:22:45
我有一個(gè)很長(zhǎng)的數(shù)據(jù)框需要展平。數(shù)據(jù)框看起來(lái)像這樣。我想展平這個(gè)表,用作referenceDate companyId索引,列應(yīng)該有兩層,第一層是data_item,第二層是N。我知道 pd.pivot 會(huì)解決這個(gè)問(wèn)題。+---------------+-----------+-----------+---+-------+| referenceDate | CompanyId | data_item | N | value |+---------------+-----------+-----------+---+-------+| 2020-01-31    |         1 | A         | 1 | 0.1   || 2020-01-31    |         2 | A         | 2 | 0.2   || 2020-01-31    |         3 | A         | 3 | 0.3   |+---------------+-----------+-----------+---+-------+然而,df = pd.pivot(df, values='value', index=['referenceDate', 'companyId'], columns=['data_item', 'N'])總是給出 valueErrorTraceback (most recent call last):  File "C:\Users\\PycharmProjects\venvs\\lib\site-packages\IPython\core\interactiveshell.py", line 3343, in run_code    exec(code_obj, self.user_global_ns, self.user_ns)  File "<ipython-input-56-3738f20d42ed>", line 1, in <module>    df = pd.pivot(df, values='value', index=['referenceDate', 'companyId'], columns=['data_item', 'N'])  File "C:\Users\\PycharmProjects\venvs\\lib\site-packages\pandas\core\reshape\pivot.py", line 429, in pivot    indexed = data._constructor_sliced(data[values].values, index=index)  File "C:\Users\\PycharmProjects\venvs\\lib\site-packages\pandas\core\series.py", line 302, in __init__    "index implies {ind}".format(val=len(data), ind=len(index))ValueError: Length of passed values is 239689, index implies 2pd.pivot_table效果很好,但在這種情況下我不需要聚合,而且我還擔(dān)心數(shù)據(jù)幀很大(數(shù)十億行)時(shí)的性能。實(shí)際上我這里確實(shí)有一個(gè)內(nèi)存錯(cuò)誤,它說(shuō)當(dāng)我執(zhí)行此操作時(shí)無(wú)法為 numpy 數(shù)組分配 1.xxGB:df = pd.pivot_table(df, values='value', index=['referenceDate', 'companyId'],                                            columns=['data_item', 'N'], aggfunc='first')我想知道為什么pd.pivot這里和旁邊失敗pd.pivot,pd.pivot_table如果我的問(wèn)題有最佳解決方案(需要最少的內(nèi)存)?
查看完整描述

1 回答

?
富國(guó)滬深

TA貢獻(xiàn)1790條經(jīng)驗(yàn) 獲得超9個(gè)贊

如果可以暫時(shí)或永久升級(jí)到較新版本的 pandas,請(qǐng)嘗試升級(jí)到較新版本的 pandas,因?yàn)閜ivot早期版本的 pandas 中存在錯(cuò)誤。


例如,您可以這樣做:pip install pandas==1.1.3升級(jí)到他們修復(fù)的特定版本pivot。


pip install pandas==1.1.3

# then restart the kernel


import pandas as pd

# df = ....

df = pd.pivot(df, values='value', index=['referenceDate', 'CompanyId'], columns=['data_item', 'N'])

df

Out[1]: 

data_item                  A          

N                          1    2    3

referenceDate CompanyId               

2020-01-31    1          0.1  NaN  NaN

              2          NaN  0.2  NaN

              3          NaN  NaN  0.3

然后,您可以隨時(shí)返回pip install pandas==0.25.3。您可以通過(guò) jupyter notebok 完成這一切。確保每次切換版本時(shí)都重新啟動(dòng)內(nèi)核。


我當(dāng)前的 pandas 版本是1.0.1,所以我也收到同樣的錯(cuò)誤!


pip install pandas==1.0.1

#restart kernel


import pandas as pd

#df = ...

df = pd.pivot(df, values='value', index=['referenceDate', 'CompanyId'], columns=['data_item', 'N'])

df

錯(cuò)誤:


ValueError                                Traceback (most recent call last)

<ipython-input-2-11248dbe0eba> in <module>

      1 df = d.copy()

----> 2 df = pd.pivot(df, values='value', index=['referenceDate', 'CompanyId'], columns=['data_item', 'N'])

      3 df


C:\Users\david.erickson\Anaconda3\lib\site-packages\pandas\core\reshape\pivot.py in pivot(data, index, columns, values)

    445             )

    446         else:

--> 447             indexed = data._constructor_sliced(data[values].values, index=index)

    448     return indexed.unstack(columns)

    449 


C:\Users\david.erickson\Anaconda3\lib\site-packages\pandas\core\series.py in __init__(self, data, index, dtype, name, copy, fastpath)

    290                     if len(index) != len(data):

    291                         raise ValueError(

--> 292                             f"Length of passed values is {len(data)}, "

    293                             f"index implies {len(index)}."

    294                         )


ValueError: Length of passed values is 3, index implies 2.


查看完整回答
反對(duì) 回復(fù) 2024-01-16
  • 1 回答
  • 0 關(guān)注
  • 179 瀏覽
慕課專(zhuān)欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢(xún)優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)