Python中pandas是什么?Pandas是基于numpy的一種工具,該工具是為了解決數據分析任務而創建的。
Pandas納入了大量的庫和一些標準的數據模型,提供了高效地操作大型數據集所需的工具。Pandas提供了大量能使我們快速便捷地處理數據的函數和方法,你很快就會發現,它是使Python成為強大而高效的數據分析環境的重要因素之一。
Pandas是Python的一個數據分析包,最初由AQRCapitalManagement于2008年4月開發,并于2009年底開源出來,目前由專注于Python數據包開發的Pydata開發team繼續開發和維護,屬于PyData項目的一部分,pandas最初被作為金融數據分析工具而開發出來,因此pandas為時間序列分析提供了很好的支持。
Pandas的名稱來自于面板數據和python數據分析。paneldata是經濟學中關于多維數據集的一個術語,在Pandas中也提供了panel的數據類型。
Pandas數據結構:
Series:一維數組,與numpy中的一維array類似。二者與Python基本的數據結構list相近,Series如今能保存不同種數據類型,字符串、boolean值、數字等都能保存在series中。
Time-series:以時間為索引的series。
DataFrame:二維的表格型數據結構,很多功能與R中的data.frame類似,可以將DataFrame理解為Series的容器。
Panel:三維的數組,可以理解為DataFrame的容器。
Panel4D:是像Panel一樣的4維數據容器。
PanelND:擁有factory集合,可以創建像Panel4D一樣N維命名容器的模塊。
以上內容為大家介紹了pandas是干什么用的,希望對大家有所幫助,如果想要了解更多Python相關知識,請關注IT培訓機構:千鋒教育。http://www.dietsnews.net/