亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

詳解python pandas 分組統計的方法

系統 2089 0

首先,看看本文所面向的應用場景:我們有一個數據集df,現在想統計數據中某一列每個元素的出現次數。這個在我們前面文章《如何畫直方圖》中已經介紹了方法,利用value_counts()就可以實現(具體回看文章)

但是,現在,我們考慮另外一個場景,我們假如要想統計其中兩列元素出現次數呢?舉個栗子:

詳解python pandas 分組統計的方法_第1張圖片

在df數據集中,如果我們想統計A、B兩列的元素的出現情況,也就是說,得到如下表。

詳解python pandas 分組統計的方法_第2張圖片

從上面的最后一列可以看到,在A、B兩列中,1 2 出現了2次,1 4 出現1次 ,1 6出現1次,2 3出現了2次, 2 4 出現1次, 3 1出現了1次

具體實現的代碼:

            
import pandas as pd
df=pd.DataFrame([[1,2,2],[1,4,5],[1,2,4],[1,6,3],[2,3,1],[2,4,1],[2,3,5],[3,1,1]],columns=['A','B','C'])
          
            
gp=df.groupby(by=['A','B'])
gp.size()

          

所以,如果想統計更多列,只要在groupby()中的by參數添加就可以,例如統計3列。

            
gp=df.groupby(by=['A','B','C'])
          

由gp.size()得到的是可以mulitiindex Series。

下面,要轉化成DataFrame的結構。

            
newdf=gp.size()
newdf.reset_index(name='times')
          

詳解python pandas 分組統計的方法_第3張圖片

其中name中參數就是我們可以為最后一列添加新的名字,例如這里的“times”

這個時候newdf已經是DataFrame的類型了。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 99热久久这里只有精品9 | 日本欧美一区二区三区 | 色综合色综合色综合网址 | 狠狠狠狠狠狠狠狠狠狠 | 亚洲天天在线日亚洲洲精 | 国内精品久久久久久久 | 成人免费视频在线看 | 国产一区二区福利久久 | 国产精品日韩欧美一区二区 | 一区二区三区四区 | 九九视频在线观看视频 | 精品国产三级 | 欧美国产精品 | 99久久免费看国产精品 | 香蕉久久久| 国产亚洲精品麻豆一区二区 | 偷拍肉窝窝视频在线播放 | 国产欧美精品一区二区三区 | 老司机午夜精品视频在线观看免费 | 米奇7777| 一级做a爱片特黄在线观看 一级做a爱片特黄在线观看免费看 | 国产精品视频久久久 | 国产玖玖在线观看 | 国产粉嫩白浆在线观看 | 国产日韩欧美中文 | 国产精品免费一区二区三区 | 久久午夜一区二区 | 四虎国产精品4hu永久 | 精品国产品香蕉在线观看75 | 很很操很很日 | 国产成人综合久久亚洲精品 | 久久99精品视免费看 | 亚洲99在线的 | 中文字幕专区高清在线观看 | 不卡午夜视频 | 香蕉在线网站 | 国产色综合久久无码有码 | 中文字幕 二区 三区 搜查官 | 激情五月婷婷基地 | 天天看片日日夜夜 | 日韩国产欧美一区二区三区 |