1 回答

TA貢獻(xiàn)1829條經(jīng)驗(yàn) 獲得超9個(gè)贊
pandas是python環(huán)境下最有名的數(shù)據(jù)統(tǒng)計(jì)包,而DataFrame翻譯為數(shù)據(jù)框,是一種數(shù)據(jù)組織方式,這么說(shuō)你可能無(wú)法從感性上認(rèn)識(shí)它,舉個(gè)例子,你大概用過(guò)Excel,而它也是一種數(shù)據(jù)組織和呈現(xiàn)的方式,簡(jiǎn)單說(shuō)就是表格,而在在pandas中用DataFrame組織數(shù)據(jù),如果你不print DataFrame,你看不到這些數(shù)據(jù),下面我們來(lái)看看DataFrame是如何使用的。
首先是引入pandas和numpy,這是經(jīng)常配合使用的兩個(gè)包,pandas依賴于numpy,引入以后我們可以直接使用np/pd來(lái)表示這個(gè)兩個(gè)模塊
先創(chuàng)建一個(gè)時(shí)間索引,所謂的索引(index)就是每一行數(shù)據(jù)的id,可以標(biāo)識(shí)每一行的唯一值
為了快速入門(mén),我們看一下如何創(chuàng)建一個(gè)6X4的數(shù)據(jù):randn函數(shù)用于創(chuàng)建隨機(jī)數(shù),參數(shù)表示行數(shù)和列數(shù),dates是上一步創(chuàng)建的索引列
我們還可以使用字典來(lái)創(chuàng)建數(shù)據(jù)框,例如創(chuàng)建一個(gè)列名為A的數(shù)據(jù)框,索引是自動(dòng)創(chuàng)建的整數(shù)
這又是一個(gè)字典創(chuàng)建DataFrame的例子
假如字典內(nèi)的數(shù)據(jù)長(zhǎng)度不同,以最長(zhǎng)的數(shù)據(jù)為準(zhǔn),比如B列有4行:
可以使用dtypes來(lái)查看各行的數(shù)據(jù)格式
接著看一下如何查看數(shù)據(jù)框中的數(shù)據(jù),看一下所有的數(shù)據(jù)
使用head查看前幾行數(shù)據(jù)(默認(rèn)是前5行),不過(guò)你可以指定前幾行
查看前三行數(shù)據(jù)
使用tail查看后5行數(shù)據(jù)
查看數(shù)據(jù)框的索引
查看列名用columns
查看數(shù)據(jù)值,用values
查看描述性統(tǒng)計(jì),用describe
使用type看一下輸出的描述性統(tǒng)計(jì)是什么樣的數(shù)據(jù)類型——DataFrame數(shù)據(jù)
使用T來(lái)轉(zhuǎn)置數(shù)據(jù),也就是行列轉(zhuǎn)換
對(duì)數(shù)據(jù)進(jìn)行排序,用到了sort,參數(shù)可以指定根據(jù)哪一列數(shù)據(jù)進(jìn)行排序。
好了,這篇入門(mén)教程到這里,后面還有很多,希望有志同道合的朋友一起交流學(xué)習(xí),有什么說(shuō)的不對(duì)的地方,請(qǐng)批評(píng)指正。
添加回答
舉報(bào)