我正在預(yù)處理一個包含 840.000 個樣本和 400 多個特征的大型數(shù)據(jù)集。我需要將數(shù)據(jù)幀存儲在單個 csv 文件中以減少內(nèi)存。因此,我應(yīng)該避免 pd.concat 因為它需要大量內(nèi)存我有不同的數(shù)據(jù)框,具體取決于變量的性質(zhì)。如何按列附加 CSV 文件?看起來:df_1.to_csv('file.csv', index=False)df_2.to_csv('file.csv', mode='a', index=False)df_3.to_csv('file.csv', mode='a', index=False)創(chuàng)建文件 file.csv,然后將 df_2 和 df_3 附加到彼此的正下方。如何按列而不是按行附加它?例子:DF1row1: variable_a variable_brow2: 0 1row3: 1 1row839999: 0 1DF2:row1: variable_c variable_drow2: 0 1row3: 1 1row839999: 0 1最終DFrow1: variable_a variable_b variable_c variable_drow2: 0 1 0 1row3: 1 1 1 1 row839999: 0 1 0 1
添加回答
舉報
0/150
提交
取消