dropna()是 pandas 庫中的一個函數,用于刪除 DataFrame 中的缺失值。在數據分析和數據清洗中,缺失值通常需要被處理。使用 可以將缺失值所在的行或列從 DataFrame 中刪除,以便進行進一步的數據分析。dropna()
下面是 函數的一些用法:dropna()
1. 刪除含有缺失值的行或列
刪除含有缺失值的行: 或df.dropna(axis=0)df.dropna()
刪除含有缺失值的列:df.dropna(axis=1)
其中, 表示按行刪除, 表示按列刪除。如果不指定 參數,則默認刪除含有缺失值的行。axis=0axis=1axis
2. 指定刪除的閾值
可以使用 參數來指定保留數據的最小非缺失值數量,若某一行或列中非缺失值數量小于該閾值,則該行或列將被刪除。thresh
按行刪除,保留至少 3 個非缺失值的行:df.dropna(thresh=3)
按列刪除,保留至少 2 個非缺失值的列:df.dropna(axis=1, thresh=2)
3. 指定刪除的位置
可以使用 參數來指定刪除缺失值的位置,以及要考慮的列。subset
刪除 “age” 列中缺失值的行:df.dropna(subset=['age'])
刪除 “age” 和 “gender” 列中缺失值的行:df.dropna(subset=['age', 'gender'])
4. 填充缺失值
除了刪除缺失值,還可以使用 函數來填充缺失值。函數可以用指定的值填充缺失值,例如:fillna()fillna()
使用 0 填充缺失值:df.fillna(0)
使用平均值填充缺失值:df.fillna(df.mean())
以上是 函數的一些常用用法,可以根據具體的需求選擇使用。