首頁(yè) 猿問(wèn) 有沒(méi)有一種方法可以組合...

有沒(méi)有一種方法可以組合 Pandas 中的多個(gè)列，可以將某些列中的所有數(shù)據(jù)連接到一列中

Python

湖上湖 2023-10-06 18:34:22

我希望這個(gè)問(wèn)題很清楚，但我正在研究 Zillow 房屋銷售數(shù)據(jù)，并且遇到了一個(gè)問(wèn)題，即能夠?qū)⒛承┠攴莸乃性路莺喜⒌叫侣暶鞯摹澳攴荨弊兞?。這基本上應(yīng)該將包含 Jan-YY、Feb-YY、Mar-YY...等的所有數(shù)據(jù)存儲(chǔ)為 YY。我嘗試過(guò) Pandas 內(nèi)置的函數(shù)，例如Stack()和Pivot()，但這些似乎不起作用。如果沒(méi)有可行的方法來(lái)做到這一點(diǎn)，我有什么選擇？提前致謝！示例：采用 Column1 = '1/31/1996'和 Column2 = '2/28/1996' …等。和 Column12 = '12/31/1996'并組合成一個(gè)名為Y1996的新列。這比每月細(xì)分更容易分析。我的代碼： import pandas as pd import numpy as np import statsmodels.api as sm import matplotlib.pyplot as plt %matplotlib inline zil = pd.read_csv('zillow.csv') df_zil = pd.DataFrame(df_zil) df_zil.head(4) #My attempt at merging into one y1996 = (df_zil['1/31/1996'] + df_zil['3/31/1996'] + df_zil['4/30/1996'] + df_zil['5/31/1996'] + df_zil['6/30/1996'] + df_zil['7/31/1996'] + df_zil['8/31/1996'] + df_zil['9/30/1996'] + df_zil['10/31/1996'] + df_zil['11/30/1996'] + df_zil['12/31/1996'])如何通過(guò) Excel 格式化數(shù)據(jù)的屏幕截圖 - 從第一列開始參考 Zillow 數(shù)據(jù)： https: //www.zillow.com/research/data/

查看完整描述

1 回答

冉冉說(shuō)

TA貢獻(xiàn)1877條經(jīng)驗(yàn) 獲得超1個(gè)贊

我認(rèn)為你需要與支點(diǎn)相反的東西——融化。您的數(shù)據(jù)采用“寬”格式，如果將數(shù)據(jù)轉(zhuǎn)換為“高”格式，則可以更輕松地進(jìn)行此匯總。獲得高格式的數(shù)據(jù)后，您可以使用 groupby 來(lái)匯總同一年內(nèi)的值。

我下載了房屋庫(kù)存和銷售數(shù)據(jù)集，并編寫了一個(gè)簡(jiǎn)短的程序來(lái)匯總同一年的所有值。

代碼：

import pandas as pd

df = pd.read_csv("Metro_invt_fs_uc_sfrcondo_smoothed_month.csv")

# Take all of the columns after the index and convert them into additional rows

df = df.melt(id_vars=["RegionID", "SizeRank", "RegionName", "RegionType", "StateName"], var_name="Date")

# Drop date, but keep year

df["Year"] = pd.to_datetime(df["Date"]).dt.year

df = df.drop("Date", axis="columns")

# Aggregate each year

df = df.groupby(["RegionID", "SizeRank", "RegionName", "RegionType", "StateName", "Year"], as_index=False).sum()

print(df)

輸出：

RegionID SizeRank RegionName RegionType StateName Year value

0 394304 74 Akron, OH Msa OH 2017 3576.0

1 394304 74 Akron, OH Msa OH 2018 42625.0

2 394304 74 Akron, OH Msa OH 2019 39078.0

3 394304 74 Akron, OH Msa OH 2020 21532.0

4 394308 60 Albany, NY Msa NY 2017 2969.0

.. ... ... ... ... ... ... ...

475 753906 75 North Port-Sarasota-Bradenton, FL Msa FL 2020 73953.0

476 753924 54 Urban Honolulu, HI Msa HI 2017 3735.0

477 753924 54 Urban Honolulu, HI Msa HI 2018 50079.0

478 753924 54 Urban Honolulu, HI Msa HI 2019 57413.0

479 753924 54 Urban Honolulu, HI Msa HI 2020 35522.0

[480 rows x 7 columns]

反對(duì) 回復(fù) 2023-10-06

1 回答
0 關(guān)注
127 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

有沒(méi)有一種方法可以組合 Pandas 中的多個(gè)列，可以將某些列中的所有數(shù)據(jù)連接到一列中

有沒(méi)有一種方法可以組合 Pandas 中的多個(gè)列，可以將某些列中的所有數(shù)據(jù)連接到一列中

1 回答

添加回答

有沒(méi)有一種方法可以組合 Pandas 中的多個(gè)列，可以將某些列中的所有數(shù)據(jù)連接到一列中