Pandas 的安裝
1. 前言
在正式進(jìn)入 Pandas 知識的學(xué)習(xí)之前,搭建一個(gè)良好的開發(fā)環(huán)境和安裝 Pandas 是必不可少的環(huán)節(jié)。本節(jié)將介紹 Anaconda 是什么,Anaconda 的下載、安裝。以及通過 Python 包安裝程序pip
安裝 Pandas模塊。
2. Anaconda 的介紹和安裝
2.1 Anaconda 是什么?
Anaconda 指的是一個(gè)開源的 Python 發(fā)行版本,它包含了 conda、Python 在內(nèi)的超過 180 個(gè)科學(xué)包及其依賴項(xiàng),它開源、安裝簡單、高性能和免費(fèi)等特點(diǎn),是我們選則該工具的原因之一。
另外就是它里面集成了 Python 語言和 Jupyter notebook 開發(fā)工具,以及用于安裝和管理軟件包的包管理器 pip,這些強(qiáng)大的工具集成,讓我們新手不必過多的花費(fèi)時(shí)間在配置環(huán)境和工具安裝上可以把更多的時(shí)間和精力去感受 Pandas 庫自身的強(qiáng)大功能。
下面我們將以 Windows10 64 位系統(tǒng)為例,進(jìn)行 Anaconda 的下載并安裝的示例。
2.2 Anaconda 的下載
1. 進(jìn)入到Anaconda官網(wǎng),找到 Download 進(jìn)入到下載頁面:
2. 進(jìn)入到下載頁面后,點(diǎn)擊下載自己電腦對應(yīng)版本的 Anaconda 進(jìn)行下載:
2.3 Anaconda 的安裝
1. 等待下載完成后,雙擊下載好的 .exe 文件,進(jìn)入到軟件的安裝界面:
2. “下一步”之后彈出界面,選擇“I Agree”,同意用戶協(xié)議:
3. 彈出用戶類型選擇窗口,選擇默認(rèn)的“Just Me(recommended)”就可以,選擇好之后點(diǎn)擊下一步:
4. 選擇自己電腦上的安裝目錄,因?yàn)槲募容^大,建議不要選擇安裝在C盤,選擇的目錄至少要有3G的存儲(chǔ)空間共使用,選擇好目錄后,點(diǎn)擊下一步:
5. 此處兩處都要勾選,雖然第一個(gè)不是必須的,但是對于我們新手可以很好的節(jié)省配置環(huán)境變量的時(shí)間,第二個(gè)是勾選將anaconda作為默認(rèn)的python開發(fā)環(huán)境,勾選之后點(diǎn)擊“Install”進(jìn)行安裝:
等待安裝的過程,這個(gè)根據(jù)電腦配置的不同,等待的時(shí)長有快有慢,耐心等待即可:
6. 等待安裝進(jìn)度條結(jié)束之后,會(huì)出現(xiàn)“Completed”提示詞,然后點(diǎn)擊"Next"下一步:
7. 然后點(diǎn)擊"Next"下一步:
8. 最后把默認(rèn)勾選的兩項(xiàng)取消勾選,再點(diǎn)擊"Finish",安裝就結(jié)束了:
Anaconda 的安裝過程很簡單,按照上面的步驟操作就可以了,因?yàn)?Anaconda 自身集成了很多的工具,以及 Python 開發(fā)語言,所以這里我們就不需要再單獨(dú)安裝 Python 了,可以看一下 Anaconda 目錄下集成的工具:
3. Pandas 的安裝
上面我們安裝的 Anaconda 工具中,里面集成了 pip 工具,它是一個(gè)軟件包管理器,可簡化 Python 軟件包的安裝,升級和卸載。
1. 我們打開python模塊包網(wǎng)站,找到 Pandas 模塊版本列表,上面我們 Anaconda 中帶的 Python 是 3.8 版本,我們下載 Pandas?1.1.3?cp38?cp38?win_amd64.whl,這里的 1.1.3 是 Pandas的版本號,cp 后面的 38 是 Python 的版本號,win_amd64 表示 Windows 64 位操作系統(tǒng):
2. 下載完成后,打開 Anaconda 中的 Anaconda Powershell Prompt 工具(類似于 Windows中命令操作窗口):
3. 看到當(dāng)前的操作路徑為:C:\Users\13965,把剛才下載的 pandas 的 pandas-1.1.3-cp38-cp38-win_amd64.whl 文件移動(dòng)到該文件夾下:
4. 復(fù)制命令:pip install pandas-1.1.3-cp38-cp38-win_amd64.whl
到命令行中,按回車鍵運(yùn)行,就會(huì)開始安裝 pandas1.1.3 :
輸出 Successfully installed pandas-1.1.3 說明已經(jīng)成功安裝了 Pandas 1.1.3 版本。
5. 接下來我們打開 Anaconda 中的 Jupyter notebook 開發(fā)工具:
6. 在該開發(fā)工具中,通過輸入下面代碼:
import pandas as pd
pd.__version__
然后,點(diǎn)擊運(yùn)行,看到輸出結(jié)果,里面包含了 Pandas 的版本信息,到此證明我們的 Pandas 開發(fā)環(huán)境已經(jīng)配置好,Pandas 庫也已經(jīng)安裝成功了。
4. Jupyter Notebook 的基本使用
Jupyter Notebook 是一款 Web 應(yīng)用,特別適合做數(shù)據(jù)處理,包括數(shù)據(jù)清理、統(tǒng)計(jì)建模、機(jī)器學(xué)習(xí)和可視化數(shù)據(jù)等等,在該工具中我們的代碼可以按獨(dú)立單元形式進(jìn)行編寫,還能方便的進(jìn)行文檔、公式、圖形圖像的輸入輸出,是我們學(xué)習(xí) Pandas 良好的開發(fā)工具。下面以編寫 Pandas 程序的開發(fā)過程,簡單介紹一下 Jupyter Notebook 的功能使用:
1. 在我們安裝的 Anaconda 文件中,找到 Jupyter Notebook 工具,并打開:
2. 首先會(huì)彈出運(yùn)行窗口,里面會(huì)顯示一些 Jupyter Notebook 工具的配置信息:
在程序啟動(dòng)之后,會(huì)打開 Notebook 服務(wù)器的運(yùn)行地址:http://localhost:8888 ,只要我們上面的后臺(tái)程序是跑起的,在游覽器中訪問該地址,都會(huì)打開 Notebook 的 Web 工作頁面:
3. 通過 New 新建文件,這里我們要新建一個(gè) Python 文件,進(jìn)行 Python 程序的編寫:
新建 Python 工作文件之后,會(huì)打開到該文件的工作窗口,進(jìn)行程序的編寫:
4. 我們可以通過雙擊文件名稱,打開重命名窗口,進(jìn)行文件的重命名:
5. 編輯和運(yùn)行代碼,我們在代碼塊單元格中進(jìn)行程序的編寫,這里我們寫了兩個(gè)代碼塊,當(dāng)鼠標(biāo)光標(biāo)選中哪個(gè)單元格時(shí),該單元格處于選中狀態(tài)(單元格左側(cè)有比較突出的藍(lán)色豎條),通過點(diǎn)擊運(yùn)行按鈕,或者快捷鍵運(yùn)行代碼塊(快捷鍵 Ctrl
+ Enter
運(yùn)行選中代碼塊,快捷鍵 shift
+ Enter
運(yùn)行選中代碼塊并跳到下一行):
上面我們講述了如何運(yùn)行獨(dú)立的代碼塊,那如果我們想要運(yùn)行所有的代碼塊呢?我們可以通過導(dǎo)航欄中的 Cell 打開進(jìn)入,可以看到更多的代碼塊操作工具,通過點(diǎn)擊 “Run All” 即可運(yùn)行所有的代碼塊:
如果說,工作頁面有很多多余的代碼塊,我們選擇某個(gè)代碼塊,過打開 File ,選中的 “Delete Cells” 既可。
6. 關(guān)閉工作文件,如果說我們打開了很多的文件進(jìn)行編寫,當(dāng)我們把該頁面關(guān)閉時(shí),并不意味這我們該文件的工作程序就關(guān)閉了,我們可通過主頁面中的文件列表,來關(guān)閉文件程序節(jié)省資源:
在結(jié)束之后,可以看到文件列表中的文件狀態(tài)“運(yùn)行”消失:
6. 退出 Jupyter Notebook ,只要關(guān)閉游覽器,然后把我們的后臺(tái)程序運(yùn)行窗口關(guān)閉即可。
5. 本節(jié)操作視頻演示
6. 小結(jié)
本節(jié)課程我們主要學(xué)習(xí)了 Anaconda3 的安裝和 Pandas1.1.3 版本的安裝,以及初識了編程工具 Jupyter notebook,Jupyter notebook 也是我們接下來學(xué)習(xí) Pandas 庫所采用的編程工具,大家課下也可以深入了解下這個(gè)工具。本節(jié)課程的重點(diǎn)如下:
- Anaconda的下載安裝;
- Pandas庫版本的選擇、安裝和驗(yàn)證方式;
- Jupyter notebook 的基本使用。
Tips:想要學(xué)習(xí)Pandas的同學(xué)可以閱讀這一門Pandas 入門教程。