麻豆黑色丝袜jk制服福利网站-麻豆精品传媒视频观看-麻豆精品传媒一二三区在线视频-麻豆精选传媒4区2021-在线视频99-在线视频a

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > padndas提供了豐富的統計、合并、分組、缺失值等操作函數

padndas提供了豐富的統計、合并、分組、缺失值等操作函數

來源:千鋒教育
發布人:qyf
時間: 2022-08-12 17:14:01 1660295641

  排序

  排序:即對里面的數據按照大小,或者按照某種規則排序。

  對DataFrame數據進行排序與Series相似,Dataframe也有按sort_values()與 sort_index()分別按照值、索引進行排序。

  參數by=“columns_name”指定排序值參考列,默認ascending=True按升序排序,指定inplace=True,將同時修改原數據。可傳入axis=1,按行標簽排序,不過用到的時候不多。

  以近期粽子銷售數據為例介紹sort_values()的使用,數據結構如下:

屏幕快照 2021-06-17 下午3.54.49

  比如我們按照價格進行排序,注意默認是升序:

  import pandas as pd

  import numpy as np

  # 按照發貨地分組

  df = pd.read_csv('zongzi.csv')

  df1 = df.sort_values(by='價格')

  df1.head()

  結果:

屏幕快照 2021-06-17 下午5.58.00

  如果按照降序排列,則需要添加參數ascending=False

  df1 = df.sort_values(by='價格',ascending=False)df1.head()

  結果:

屏幕快照 2021-06-17 下午6.00.26

  統計函數

  padndas提供了豐富的統計、合并、分組、缺失值等操作函數。

  比如靈活高效的groupby功能,它使你能以一種自然的方式對數據集進行切片、切塊、摘要等操作。而如果使用groupby函數則肯定與下面的統計函數息息相關。

  常用的統計函數有:

  df.count() 非空元素計算

  df.min() 最小值

  df.max() 最大值

  df.idxmin() 最小值的位置,類似于R中的which.min函數

  df.idxmax() 最大值的位置,類似于R中的which.max函數

  df.quantile(0.1) 10%分位數

  df.sum() 求和

  df.mean() 均值

  df.median() 中位數

  df.mode() 眾數

  df.var() 方差

  df.std() 標準差

  df.mad() 平均絕對偏差

  df.skew() 偏度

  df.kurt() 峰度

  df.describe() 一次性輸出多個描述性統計指標

  groupby使用介紹

  分組運算"split-apply-combine"(拆分-應?-合并)。第?個階段,pandas對象(?論是Series、DataFrame還是其他的)中的數據會根據你所提供的?個或多個鍵被拆分(split)為多組。拆分操作是在對象的特定軸上執?的。例如,DataFrame可以在其?(axis=0)或列(axis=1)上進?分組。然后,將?個函數應?(apply)到各個分組并產??個新值。最后,所有這些函數的執?結果會被合并(combine)到最終的結果對象中。

屏幕快照 2021-06-17 下午5.36.47

  groupby的語法結構如下:

  * by 分組的行或者列

  * axis=0 行 / 1 列

  * 如果有多層索引可以使用level

  以近期粽子銷售數據為例介紹groupby的使用:

  數據結構如下

屏幕快照 2021-06-17 下午3.54.49

  groupby對象的屬性和內容獲取

  import pandas as pd

  import numpy as np

  # 按照發貨地分組

  df = pd.read_csv('zongzi.csv')

  grouped = df.groupby('發貨地')

  print(grouped)

  打印結果:

  <pandas.core.groupby.generic.dataframegroupby 0x11a97a950="" at="" object="">

  查看grouped的組成groups

  grouped.groups

屏幕快照 2021-06-17 下午3.55.26

  當然大家也可以對grouped進行遍歷查看結果:

  for group in grouped: print(group)

屏幕快照 2021-06-17 下午5.41.31

  這么多分組,我們可以選擇一個分組進行查看:

  grouped.get_group('上海')

屏幕快照 2021-06-17 下午3.55.41

  按照某一列分組并進行統計

  # 結合統計函數count(),進行發貨地的個數統計

  import pandas as pd

  import numpy as np

  # 按照產地分組并統計個數

  df = pd.read_csv('zongzi.csv')

  grouped = df.groupby('發貨地')

  grouped['發貨地'].count().sort_values(ascending=False) # 統計各個發貨地的個數并降序排列

  結果:

屏幕快照 2021-06-17 下午3.59.36

  當然也可以獲取各個店鋪商品的數量(注意如果是各個店鋪則是按照店鋪分組,然后再對商品名稱進行個數統計)

  df['商品名稱'].groupby(df['店鋪']).count().sort_values(ascending=False)

  結果:

屏幕快照 2021-06-17 下午4.04.37

  各個店鋪的銷量總和,銷量列是字符串列

  df.info()

屏幕快照 2021-06-17 下午4.08.04

  所以在進行求和之前我們要進行轉換,只提取銷量的數字變成整型類型的

  import pandas as pd

  import numpy as np

  import re

  df = pd.read_csv('zongzi.csv')

  # 清洗缺失值的數據,進行填充

  df['銷量'].fillna('0人付款', inplace=True)

  def convert_sale(row):

  if '+' in row['銷量']:

  row['銷量'] = row['銷量'].replace('+', '')

  print(row)

  if '萬' in row['銷量']:

  return float(re.search(r'(.+)萬人付款', row['銷量']).group(1)) * 10000

  else:

  return int(re.search(r'(.+)人付款', row['銷量']).group(1))

  df['銷量1'] = df.apply(convert_sale, axis=1)

  然后計算總和:

  df['銷量1'].groupby(df['店鋪']).sum().sort_values(ascending=False)

  按照多列分組,比如每個發貨地的各個店鋪的銷量總和

  df.groupby(['發貨地','店鋪'])['銷量1'].sum().sort_values(ascending=False)

  獲取分組后的某一部分數據可以使用如下格式:

  grouped = df.groupby(by=['O', 'N'])

  grouped.count()['M']

  或

  grouped['M'].count()

  所以運行后的結果:

屏幕快照 2021-06-17 下午5.47.59

  當然還有一些復雜的使用,下篇文章給大家詳細介紹。

  更多關于“Python培訓”的問題,歡迎咨詢千鋒教育在線名師。千鋒教育多年辦學,課程大綱緊跟企業需求,更科學更嚴謹,每年培養泛IT人才近2萬人。不論你是零基礎還是想提升,都可以找到適合的班型,千鋒教育隨時歡迎你來試聽。

tags:
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT
主站蜘蛛池模板: 经典三级在线播放| 免费a级毛片无码| 樱桃视频高清免费观看在线播放| 国产乱子伦在线观看| 台湾swag在线观看| 中文字幕无线码中文字幕免费| avtt亚洲天堂| 国产高清露脸| 性欧美18-19sex性高清播放| 播播开心激情网| 女人扒开下面让男人桶爽视频| 亚洲国产婷婷综合在线精品| 妖精的尾巴ova| 亚洲高清成人欧美动作片| 翁虹三级在线伦理电影| 免费污视频在线| 男人扒开女人的腿做爽爽视频| 一二三四视频社区在线| 成年男女免费视频网站| 亚洲另类视频在线观看| 孩交精品xxxx视频视频| 欧美一级亚洲一级| 成人动漫影院| 美女的扒开尿口让男人桶动态图| 国产草草影院| 黑人性生活片| 亚洲日韩中文字幕在线播放| 美女奶口隐私免费视频网站| 欧美精品一区二区三区视频| 美女把尿口扒开让男人添| 免费a级毛片18以上观看精品| 亚洲精品国产成人| 精品麻豆国产| 日韩伦理电影在线免费观看| 成人性生交大片免费看| 制服丝袜电影在线观看| 久热精品在线| 免费人成在线观看视频播放| 波多野结衣一区二区三区88| 国产精品国产三级国产普通话| 欧美a级成人淫片免费看|