第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

Pandas 簡介

圖片來源:Pandas 中文網(wǎng)

大家好,歡迎閱讀這門 Pandas教程。

如果你是一個數(shù)據(jù)開發(fā)人員,我想你應(yīng)該對 Pandas 并不陌生。如果你從沒有聽說過也沒有關(guān)系,這節(jié)課我們將對 Pandas 做一個系統(tǒng)的介紹,看完這節(jié)課你應(yīng)該對 Pandas 是什么,能用來做什么有一個大致的了解。

好了,話不多說,下面就讓我們一起來走進 Pandas 的世界。

1. Pandas 是什么?

Pandas 是由 Wes McKinny 于 2008 年設(shè)計和開發(fā),并于 2009 年底開源出來。最初的出現(xiàn)是為了彌補Python 在科學計算上的速度慢和資源消耗大的缺點,隨著不斷的發(fā)展,Pandas 庫越來越成熟和穩(wěn)定,已經(jīng)成為了 Python 在科學計算中的重要模塊之一,廣泛的應(yīng)用于數(shù)據(jù)分析、機器學習和深度學習等領(lǐng)域。隨著大數(shù)據(jù)、人工智能領(lǐng)域發(fā)展的突飛猛進,Pandas 的出場頻率越來越高,對于數(shù)據(jù)科學問題的處理越來越成熟、穩(wěn)定和高效。

作為 Python 語言的一個第三方庫,Pandas 在程序中可以很方便的進行引用。但是不得不說的是。Pandas 是在 Python 的另一個科學計算庫 Numpy 的基礎(chǔ)上進行開發(fā)的,因此 Pandas 采用了大量的 Numpy 編碼風格。

但它在性能上要優(yōu)于 Numpy,Numpy 比較適合處理統(tǒng)一的數(shù)值數(shù)組數(shù)據(jù),而 Pandas 主要提供了兩種數(shù)據(jù)結(jié)構(gòu):一維數(shù)組(Series)和二維數(shù)組(DataFrame),可以說是專門用來處理表格混雜數(shù)據(jù)的工具。

Tips:想要學習 Numpy 庫的同學可以閱讀這一門慕課教程。

2. Pandas 的特點

Pandas 有很多的特點,它的創(chuàng)始人 Wes McKinney 在談到 Pandas 時,總結(jié)了它的 9 個特性:

  1. 對表格類型數(shù)據(jù)的讀取和輸出速度非???;
  2. 時間序列處理;
  3. 數(shù)據(jù)隊列;
  4. 處理缺失數(shù)據(jù);
  5. 分組運算;
  6. 分級索引;
  7. 數(shù)據(jù)的合并和加入;
  8. 數(shù)據(jù)透視表;
  9. 數(shù)據(jù)歸納和分析。

當然除了這九點,Pandas 還有很多其他的優(yōu)點,比如豐富的操作函數(shù)等,后面的課程中我們也會一一將 Pandas 的這些優(yōu)點展現(xiàn)給大家。

當我們最開始接觸 Pandas 時,很明了的就能感覺它在數(shù)據(jù)處理速度上的優(yōu)勢,以及它對于缺失數(shù)據(jù)處理的便捷性,還有它自身含有的數(shù)據(jù)歸納和分析函數(shù)。

正是這簡單的操作,快速的運算和自身帶有的強大的函數(shù)等功能特性,使得需要數(shù)據(jù)處理分析的用戶能很輕松的入手這個工具,并且?guī)淼男Ч质悄敲大@嘆,正是這些讓越來越多的需求選擇了入手它,并在使用中深入的了解它,最終掌握它、贊嘆它。

3. Pandas 的主要版本有哪些?教程使用什么版本?

Pandas 從 2009 年 12 月 26 日發(fā)布的 0.1 版本,發(fā)展到現(xiàn)在的 1.1.3 版本,中間各種版本經(jīng)歷了八十次左右的迭代,也正是它不斷的發(fā)展、迭代才有了現(xiàn)在的成熟和穩(wěn)定,Pandas 迭代中有很多重要的版本,這里我們要強調(diào)一下 Pandas 的幾個版本:

  • V0.24.2:該版本修復了0.24.x系列中的一些小錯誤,包括一些回歸修復,錯誤修復和性能改進;
  • V0.25.0:這是 0.24.2 之后的另一個主要版本,大量的 API 更改,功能的改進和大量錯誤的修復;
  • V1.0.0:該版本新增了 StringDtype 數(shù)據(jù)類型,新增了表格導出為markdown的格式等新的內(nèi)容。

本教程采用的是 Pandas 的最新 1.1.3 版本,該版本支持較新的 Python 3.9 版本,修復了整數(shù)一元加減運算中引起的類型錯誤,修復了 DataFrame.sort_values() 操作時出現(xiàn)的 AttributeError 錯誤等等,可以到官網(wǎng)查看 Pandas 1.1.3 的新特性。如果學習中,要使用其他版本的 Pandas ,要注意對 Python 版本的支持,

4. Pandas 與其他同類型框架的對比

5.1 軟件 SAS

對于商業(yè)軟件 SAS 而言,雖然它擁有良好的 GUI 方便用戶操作,但是購買價格比較昂貴,讓很多個體用戶望而止步。并且它的統(tǒng)計功能更新速度要不是很及時,而對比之下,Pandas 不僅開源免費,并且功能強大,成為了越來越多個體、科研機構(gòu)、或者企業(yè)的不二之選。

5.2 R 庫

R 庫作為 SAS 的開源對應(yīng)物,Pandas 庫和 R 庫在數(shù)據(jù)處理和分析方面都比較專業(yè),Linux、Windows 均可使用,并且代碼可移植性都比較好,兩個庫之間存在一定的互補性,但處理速度方面 Pandas 庫要優(yōu)于 R 庫,Pandas 是 Python 的第三方庫,在數(shù)據(jù)結(jié)構(gòu)上也更為豐富。

5.3 SQL 工具

Pandas 庫和 SQL 工具相比較,如果是處理存在數(shù)據(jù)庫中的數(shù)據(jù),SQL 相對而言要方便一些,但目前大數(shù)據(jù)發(fā)展性,數(shù)據(jù)的來源大多數(shù)是通過網(wǎng)絡(luò)爬蟲而來,通過Python爬蟲程序,生成的數(shù)據(jù)文件一般是txt、csv 或者 Excel,這時候 SQL 就不太好用了,Pandas 的優(yōu)勢也就提現(xiàn)出來,它不論是數(shù)據(jù)的讀取和導出都很方便,而且 SQL 中有的數(shù)據(jù)處理功能,都可以由 Pandas 來實現(xiàn)。

通過和其他數(shù)據(jù)處理分析工具的對比,從成本投入、操作復雜度、處理能力等多方面考慮來看,Pandas 成為當下最火的數(shù)據(jù)處理工具也是當之無愧的。

目前來說,大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)發(fā)展成為了一種新型服務(wù)產(chǎn)業(yè),已經(jīng)逐漸的延伸到科學和商業(yè)等領(lǐng)域,隨著大數(shù)據(jù)技術(shù)的發(fā)展和應(yīng)用產(chǎn)品的不斷迭代更新,大數(shù)據(jù)中所蘊含的價值被不斷的開采出來,同時,大數(shù)據(jù)分析行業(yè)的人才需求量也越來越大,行業(yè)中給出的待遇水平也相對較高。

而 Python 語言中的 Pandas 庫憑借著自身在大數(shù)據(jù)處理和分析中的簡潔方便、穩(wěn)定、高效等多方面的優(yōu)勢,在大數(shù)據(jù)領(lǐng)域中的位置越來越重要,也越來越被用戶所認可,成為了大數(shù)據(jù)分析、人工智能等領(lǐng)域必不可少的選擇。

學習 Pandas 有以下這些你無法拒絕的理由:

  • 易于學習和使用;
  • 社區(qū)資源多且豐富;
  • Pandas庫成熟穩(wěn)定;
  • Pandas庫功能豐富;
  • 提高數(shù)據(jù)分析生成力;
  • 就業(yè)前景廣;
  • 薪資待遇高。

總之,不管你是一名上班族,還一名科學的研究者,Pandas 的學習對你來說都是很有價值的,在工作和辦公中隨時都會接觸到大量的數(shù)據(jù),對于數(shù)據(jù)的處理和分析成為了必不可少的工作內(nèi)容之一,Pandas 能大大的提高工作的效率。通過接下來進一步的接觸和學習,Pandas 在數(shù)據(jù)處理和分析上的亮點一定會讓你贊嘆!

7. 本門課程是如何設(shè)計的?

本課程主要是 Pandas入門基礎(chǔ)知識,從簡單到復雜,帶領(lǐng)大家了解 Pandas 的數(shù)據(jù)結(jié)構(gòu),掌握 Pandas豐富的操作方法,進一步的認識 Pandas 的一些高級功能,按照 Pandas 庫的數(shù)據(jù)結(jié)構(gòu)和功能模塊層層深入,一層一層的揭開 Pandas 的神秘面紗。

課程主要涉及 Pandas 開發(fā)環(huán)境的安裝,Pandas 數(shù)據(jù)相關(guān)的操作,Pandas 的統(tǒng)計描述,以及 Pandas時間序列等知識點,針對每一塊的知識,按照功能模塊展開到每一小節(jié),再具體到每一個操作方法上,會從概念描述、代碼演示和注意事項等多個角度講述知識點,使學生能輕松的學習 Pandas 庫,熟練的掌握 Pandas 庫的基礎(chǔ)知識。

8. 學習這門課程需要有什么基礎(chǔ)?

  1. 學習這么課程首先要有python語言編程基礎(chǔ);
  2. 有一定的 Numpy 庫使用基礎(chǔ),會更加有利于 Pandas 庫的學習和使用。

Tips:想要學習 Numpy 庫的同學可以閱讀這一門慕課教程。