1 回答

TA貢獻(xiàn)1864條經(jīng)驗(yàn) 獲得超6個(gè)贊
我們最初可以根據(jù)上述條件僅讀取我們想要過(guò)濾的特定列(假設(shè)這會(huì)顯著減少讀取開(kāi)銷)。
#reading the mask column
df_indx = (pd.read_csv(filename, error_bad_lines=False,usecols=['Accident_Index'])
[lambda x: x['Accident_Index'].str.startswith('2005')])
然后,我們可以使用該列中的值,使用skiprows和nrows屬性從文件中讀取剩余的列,因?yàn)樗鼈兪禽斎胛募械呐判蛑?/p>
df_data= (pd.read_csv(filename,
error_bad_lines=False,header=0,skiprows=df_indx.index[0],nrows=df_indx.shape[0]))
df_data.columns=['Accident_index','data']
這將給出我們想要的數(shù)據(jù)的子集。我們可能不需要單獨(dú)獲取列名。
添加回答
舉報(bào)