第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

有沒(méi)有一種方法可以組合 Pandas 中的多個(gè)列,可以將某些列中的所有數(shù)據(jù)連接到一列中

有沒(méi)有一種方法可以組合 Pandas 中的多個(gè)列,可以將某些列中的所有數(shù)據(jù)連接到一列中

湖上湖 2023-10-06 18:34:22
我希望這個(gè)問(wèn)題很清楚,但我正在研究 Zillow 房屋銷售數(shù)據(jù),并且遇到了一個(gè)問(wèn)題,即能夠?qū)⒛承┠攴莸乃性路莺喜⒌叫侣暶鞯摹澳攴荨弊兞?。這基本上應(yīng)該將包含 Jan-YY、Feb-YY、Mar-YY...等的所有數(shù)據(jù)存儲(chǔ)為 YY。我嘗試過(guò) Pandas 內(nèi)置的函數(shù),例如Stack()和Pivot(),但這些似乎不起作用。如果沒(méi)有可行的方法來(lái)做到這一點(diǎn),我有什么選擇?提前致謝!示例:采用 Column1 = '1/31/1996'和 Column2 = '2/28/1996' …等。和 Column12 = '12/31/1996'并組合成一個(gè)名為Y1996的新列。這比每月細(xì)分更容易分析。我的代碼:  import pandas as pd  import numpy as np  import statsmodels.api as sm  import matplotlib.pyplot as plt   %matplotlib inline  zil = pd.read_csv('zillow.csv')  df_zil = pd.DataFrame(df_zil)  df_zil.head(4)  #My attempt at merging into one  y1996 = (df_zil['1/31/1996'] + df_zil['3/31/1996'] + df_zil['4/30/1996'] + df_zil['5/31/1996'] +   df_zil['6/30/1996'] + df_zil['7/31/1996'] + df_zil['8/31/1996'] + df_zil['9/30/1996'] +   df_zil['10/31/1996'] + df_zil['11/30/1996'] + df_zil['12/31/1996'])如何通過(guò) Excel 格式化數(shù)據(jù)的屏幕截圖 - 從第一列開始參考 Zillow 數(shù)據(jù): https: //www.zillow.com/research/data/
查看完整描述

1 回答

?
冉冉說(shuō)

TA貢獻(xiàn)1877條經(jīng)驗(yàn) 獲得超1個(gè)贊

我認(rèn)為你需要與支點(diǎn)相反的東西——融化。您的數(shù)據(jù)采用“寬”格式,如果將數(shù)據(jù)轉(zhuǎn)換為“高”格式,則可以更輕松地進(jìn)行此匯總。獲得高格式的數(shù)據(jù)后,您可以使用 groupby 來(lái)匯總同一年內(nèi)的值。

我下載了房屋庫(kù)存和銷售數(shù)據(jù)集,并編寫了一個(gè)簡(jiǎn)短的程序來(lái)匯總同一年的所有值。

代碼:

import pandas as pd


df = pd.read_csv("Metro_invt_fs_uc_sfrcondo_smoothed_month.csv")

# Take all of the columns after the index and convert them into additional rows

df = df.melt(id_vars=["RegionID", "SizeRank", "RegionName", "RegionType", "StateName"], var_name="Date")

# Drop date, but keep year

df["Year"] = pd.to_datetime(df["Date"]).dt.year

df = df.drop("Date", axis="columns")

# Aggregate each year

df = df.groupby(["RegionID", "SizeRank", "RegionName", "RegionType", "StateName", "Year"], as_index=False).sum()

print(df)

輸出:


     RegionID  SizeRank                         RegionName RegionType StateName  Year    value

0      394304        74                          Akron, OH        Msa        OH  2017   3576.0

1      394304        74                          Akron, OH        Msa        OH  2018  42625.0

2      394304        74                          Akron, OH        Msa        OH  2019  39078.0

3      394304        74                          Akron, OH        Msa        OH  2020  21532.0

4      394308        60                         Albany, NY        Msa        NY  2017   2969.0

..        ...       ...                                ...        ...       ...   ...      ...

475    753906        75  North Port-Sarasota-Bradenton, FL        Msa        FL  2020  73953.0

476    753924        54                 Urban Honolulu, HI        Msa        HI  2017   3735.0

477    753924        54                 Urban Honolulu, HI        Msa        HI  2018  50079.0

478    753924        54                 Urban Honolulu, HI        Msa        HI  2019  57413.0

479    753924        54                 Urban Honolulu, HI        Msa        HI  2020  35522.0


[480 rows x 7 columns]


查看完整回答
反對(duì) 回復(fù) 2023-10-06
  • 1 回答
  • 0 關(guān)注
  • 127 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)