我有一個(gè) tsv 文件,其中包含 100k 條記錄,這些記錄具有順序索引值,index col1 col20 nnn yyy 1 nnn yyy2 nnn yyy3 nnn yyy4 nnn yyy5 nnn yyy.....99999 nnn yyy我需要將索引值修改為隨機(jī) ['0', '1'] 之類的,index col1 col20 nnn yyy 1 nnn yyy1 nnn yyy0 nnn yyy1 nnn yyy0 nnn yyy...........1 nnn yyy
1 回答

LEATH
TA貢獻(xiàn)1936條經(jīng)驗(yàn) 獲得超7個(gè)贊
DataFrame.set_index搭配使用numpy.random.choice:
df = df.set_index(np.random.choice([0, 1], size=len(df)))
或具有分配索引的類似解決方案:
df.index = np.random.choice([0, 1], size=len(df))
print (df)
col1 col2
1 nnn yyy
0 nnn yyy
1 nnn yyy
1 nnn yyy
0 nnn yyy
0 nnn yyy
1 nnn yyy
添加回答
舉報(bào)
0/150
提交
取消