Python近幾年十分流行,不少小伙伴都來學習Python了,都知道Python有幾大方向,如爬蟲、Python開發工程師、數據分析、人工智能等,本篇針對數據分析學科,給大家講解Numpy和Pandas函數,使用高效函數會使數據分析更為容易、簡單,請看下文:
Numpy的高效函數
1、argpartition():借助它,Numpy可以找出N個最大數值的索引,也會將找到的索引進行輸出,進而根據需要對數值進行排序。
2、allclose():適用于匹配兩個數組,進而得到布爾值表示的輸出。如果在一個范圍內(withinatolerance)兩個數組不等同,則會返回False。該函數對于檢查兩個數組是否相似非常有用。
3、clip():使一個數組中的數值保持在區間內。在需要保證數值在上下限范圍的情況下,可以借助clip()函數實現該目的。
4、extract():它是在特定條件下從一個數組中提取特定元素,還可以使用and和or等條件。
5、where():用于從一個數組中返回滿足條件的數據。比如,它會返回滿足條件的數據的索引位置。
6、percentile():用于計算特定軸方向上數組元素的第n個百分位數。
Pandas的高效函數
1、read_csv:大多數新手都會犯的一個錯誤是,在不需要.csv文件的情況下仍會完整地讀取它。如果一個未知的.csv文件有10GB,那么讀取整個.csv文件將會非常不明智,不僅要占用大量內存,還會花很多時間。我們需要做的只是從.csv文件中導入幾行,之后根據需要繼續導入。
2、map():根據輸入來映射Series的值。用于將一個Series中的每個值替換為另一個值。
3、apply():允許用戶傳遞函數,并將其應用于Pandas序列中的每個值。
4、isin():用于過濾數據幀。Isin()有助于選擇特定列中具有特定(或多個)值的行。
5、copy():用于復制Pandas對象。當一個數據分配給另一個數據時,如果其中一個數據進行了修改,另一個數據的值也會發生改變。這種時候就可以使用copy()函數。
6、select_dtypes():這個函數的參數可設置為包含所擁有特定數據類型的列,也可以設置為排除具有特定數據類型的列。