現(xiàn)有數(shù)據(jù)如下(真實(shí)情況大概幾十萬(wàn)行):比如有另個(gè)文件p.txt,里面有一列數(shù),如下:“82400041467896108240004356417597……8240004146757344”我需要抽取數(shù)據(jù)中第四列為p.txt中的數(shù),該有什么快速的方法嗎(方法不限定于pandas)?其實(shí)就是個(gè)抽樣過(guò)程,抽指定的樣本,第四列為指定文件里的數(shù)?,F(xiàn)在的想法是在p.txt里循環(huán),然后用pandas讀取原始數(shù)據(jù),第四列==循環(huán)的數(shù)就提取出來(lái),是否有更快捷的方法?
2 回答

開(kāi)滿天機(jī)
TA貢獻(xiàn)1786條經(jīng)驗(yàn) 獲得超13個(gè)贊
可以考慮用pandas的apply,減去p.txt循環(huán)和后繼矩陣拼接的步驟。
即讀取p.txt里的數(shù)據(jù)轉(zhuǎn)成一個(gè)list例如P,然后用pandas讀取原始數(shù)據(jù),執(zhí)行:

侃侃無(wú)極
TA貢獻(xiàn)2051條經(jīng)驗(yàn) 獲得超10個(gè)贊
可以考慮用pandas的apply,減去p.txt循環(huán)和后繼矩陣拼接的步驟。
即讀取p.txt里的數(shù)據(jù)轉(zhuǎn)成一個(gè)list例如P,然后用pandas讀取原始數(shù)據(jù),執(zhí)行:
添加回答
舉報(bào)
0/150
提交
取消