首頁猿問將數(shù)組列表轉換為數(shù)據(jù)幀

將數(shù)組列表轉換為數(shù)據(jù)幀

Python

瀟瀟雨雨 2022-08-11 17:55:32

你好，我有一個看起來像這樣的數(shù)據(jù)集：array([['1;"Female";133;132;124;"118";"64.5";816932'], ['2;"Male";140;150;124;".";"72.5";1001121'], ['3;"Male";139;123;150;"143";"73.3";1038437'], ['4;"Male";133;129;128;"172";"68.8";965353'], ['5;"Female";137;132;134;"147";"65.0";951545'], ['6;"Female";99;90;110;"146";"69.0";928799'], ['7;"Female";138;136;131;"138";"64.5";991305']], dtype=object)我想將 is 轉換為具有此列的數(shù)據(jù)幀columns = ["Gender";"FSIQ";"VIQ";"PIQ";"Weight";"Height";"MRI_Count"]注意：從數(shù)組列表中，行值的分隔符是一個分號（;)。幫助我將其組織到具有列名和數(shù)組中的行值的數(shù)據(jù)幀

查看完整描述

2 回答

子衿沉夜

TA貢獻1828條經(jīng)驗獲得超3個贊

創(chuàng)建和系列.str.split 對于新列：DataFrameexpand=True

a = np.array([['1;"Female";133;132;124;"118";"64.5";816932'],

['2;"Male";140;150;124;".";"72.5";1001121'],

['3;"Male";139;123;150;"143";"73.3";1038437'],

['4;"Male";133;129;128;"172";"68.8";965353'],

['5;"Female";137;132;134;"147";"65.0";951545'],

['6;"Female";99;90;110;"146";"69.0";928799'],

['7;"Female";138;136;131;"138";"64.5";991305']], dtype=object)

df = pd.DataFrame(a)[0].str.split(';', expand=True)

df.columns = ['ID',"Gender","FSIQ","VIQ","PIQ","Weight","Height","MRI_Count"]

最后一些數(shù)據(jù)清理 - 由Series.str.strip刪除，并通過使用DataFrame.apply to_numeric將列轉換為數(shù)字：""

df['Gender'] = df['Gender'].str.strip('"')

c = ["ID", "FSIQ","VIQ","PIQ","Weight","Height","MRI_Count"]

df[c] = df[c].apply(lambda x: pd.to_numeric(x.str.strip('"'), errors='coerce'))

print (df)

ID Gender FSIQ VIQ PIQ Weight Height MRI_Count

0 1 Female 133 132 124 118.0 64.5 816932

1 2 Male 140 150 124 NaN 72.5 1001121

2 3 Male 139 123 150 143.0 73.3 1038437

3 4 Male 133 129 128 172.0 68.8 965353

4 5 Female 137 132 134 147.0 65.0 951545

5 6 Female 99 90 110 146.0 69.0 928799

6 7 Female 138 136 131 138.0 64.5 991305

反對回復 2022-08-11

婷婷同學_

TA貢獻1844條經(jīng)驗獲得超8個贊

另一個潛在的解決方案是使用io。StringIO 和 pandas.read_csv。只需用一個字符連接數(shù)組中的每個元素：\n

from io import StringIO

# Setup

a = np.array([['1;"Female";133;132;124;"118";"64.5";816932'],

['2;"Male";140;150;124;".";"72.5";1001121'],

['3;"Male";139;123;150;"143";"73.3";1038437'],

['4;"Male";133;129;128;"172";"68.8";965353'],

['5;"Female";137;132;134;"147";"65.0";951545'],

['6;"Female";99;90;110;"146";"69.0";928799'],

['7;"Female";138;136;131;"138";"64.5";991305']])

columns = ["Gender", "FSIQ", "VIQ", "PIQ", "Weight", "Height", "MRI_Count"]

df = pd.read_csv(StringIO('\n'.join(a.ravel())), header=None,

sep=';', names=columns, na_values=['.'])

[輸出]

Gender FSIQ VIQ PIQ Weight Height MRI_Count

1 Female 133 132 124 118.0 64.5 816932

2 Male 140 150 124 NaN 72.5 1001121

3 Male 139 123 150 143.0 73.3 1038437

4 Male 133 129 128 172.0 68.8 965353

5 Female 137 132 134 147.0 65.0 951545

6 Female 99 90 110 146.0 69.0 928799

7 Female 138 136 131 138.0 64.5 991305

pandas應該做得很好解釋dtypes

print(df.info())

Int64Index: 7 entries, 1 to 7

Data columns (total 7 columns):

# Column Non-Null Count Dtype

--- ------ -------------- -----

0 Gender 7 non-null object

1 FSIQ 7 non-null int64

2 VIQ 7 non-null int64

3 PIQ 7 non-null int64

4 Weight 6 non-null float64

5 Height 7 non-null float64

6 MRI_Count 7 non-null int64

dtypes: float64(2), int64(4), object(1)

memory usage: 448.0+ bytes

反對回復 2022-08-11

2 回答
0 關注
158 瀏覽

關注

添加回答

舉報

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

將數(shù)組列表轉換為數(shù)據(jù)幀

將數(shù)組列表轉換為數(shù)據(jù)幀

2 回答

添加回答