【数据处理包Pandas】分组及相关操作-365bet官方博客-365bet官方博客-365bet比分网-365bet欧洲版官网

准备工作

代码语言：javascript复制import numpy as np

import pandas as pd

%matplotlib inline数据集team.xlsx下载地址：

链接：https://pan.quark.cn/s/9e3b2a933510

提取码：7i2y

代码语言：javascript复制df = pd.read_excel("team.xlsx")

df.head()代码语言：javascript复制# 分组前总体统计情况

df.describe()一、初步认识分组并查看分组信息按team列分组，team列中值相同的记录构成一组，但是不做聚合计算或其他操作，看不到分组结果。

代码语言：javascript复制df.groupby('team')df.groupby('team')等价于df.groupby(df['team'])或者df.groupby(df.team)（当列名是字符串时两者等价）。

代码语言：javascript复制（一）通过聚合函数查看分组信息代码语言：javascript复制df.groupby('team').mean()可见分组信息类似于 DataFrame，但其实它是 DataFrameGroupBy 对象。它以分组字段作为行索引，而列索引则包含所有可以求均值的那些列（name字段不能求均值，被舍弃了）。

代码语言：javascript复制tm = df.groupby('team').mean()

tm.plot()代码语言：javascript复制查看每组前2条记录：

代码语言：javascript复制df.groupby('team').head(2)查看每组后2条记录：

代码语言：javascript复制df.groupby('team').tail(2)（二）转换成列表查看所有组的信息每一组信息形成列表中的一个元组，元组的第一个元素是组名，第2个元素是一个包含数据的 DataFrame。

代码语言：javascript复制list(df.groupby('team'))代码语言：javascript复制[('A', name team Q1 Q2 Q3 Q4

2 Ack A 57 60 18 84

7 Lfie A 9 10 99 37

9 Oscar A 77 9 26 67

16 Joshua A 63 4 80 30

17 Henry A 91 15 75 17

20 Lucas A 60 41 77 62

22 Arthur A 44 53 42 40

34 Reggie1 A 30 12 23 9

40 Toby A 52 27 17 68

42 Dylan A 86 87 65 20

51 Hugo0 A 28 25 14 71

67 Caleb A 64 34 46 88

70 Nathan A 87 77 62 13

71 Blake A 78 23 93 9

75 Stanley A 69 71 39 97

79 Tyler A 75 16 44 63

88 Aaron A 96 75 55 8), ('B', name team Q1 Q2 Q3 Q4

6 Acob B 61 95 94 8

10 Leo B 17 4 33 79

11 Logan B 9 89 35 65

14 Thomas B 80 48 56 41

25 Harrison B 89 13 18 75

30 Edward B 57 38 86 87

35 Samuel B 9 38 88 66

38 Elijah B 97 89 15 46

39 Harley B 2 99 12 13

50 Jenson B 66 77 88 74

53 Frankie B 18 62 52 33

56 David B 21 47 99 2

58 Lewis B 4 34 77 28

60 Ronnie B 53 13 34 99

64 Harvey2 B 43 76 87 90

77 Michael B 89 21 59 92

78 Elliott B 9 31 33 60

83 Albert0 B 85 38 41 17

84 Kai B 66 45 13 48

85 Liam B 2 80 24 25

92 Grayson7 B 59 84 74 33

93 Jamie0 B 39 97 84 55), ('C', name team Q1 Q2 Q3 Q4

1 Arry C 36 37 37 57

3 Eorge C 93 96 71 78

5 Harlie C 24 13 87 43

12 Archie C 83 89 59 68

13 Theo C 51 86 87 27

18 William C 80 68 3 26

28 Daniel C 50 50 72 61

32 Alexander C 91 76 26 79

33 Adam C 90 32 47 39

37 Sebastian C 1 14 68 48

46 Tommy C 29 44 28 76

47 Jake3 C 69 23 11 40

54 Ollie3 C 10 76 30 36

62 Matthew C 44 33 41 98

73 Elliot C 15 17 76 22

81 Ellis C 34 34 77 42

86 Calum C 14 91 16 82

87 Louis2 C 13 94 51 22

91 Connor C 62 38 63 46

95 Gabriel C 48 59 87 74

96 Austin7 C 21 31 30 43

97 Lincoln4 C 98 93 1 20), ('D', name team Q1 Q2 Q3 Q4

4 Oah D 65 49 61 86

8 Reddie D 64 93 57 72

21 Ethan D 79 45 89 88

23 Mason D 80 96 26 49

27 Finley D 62 73 84 68

44 Benjamin D 15 88 52 25

48 Louie D 24 84 54 11

49 Carter7 D 57 52 77 50

52 Bobby1 D 50 55 60 59

57 Albie1 D 79 82 56 96

59 Luca D 5 40 91 83

63 Alex D 14 70 55 87

65 Reuben D 70 72 76 56

66 Jayden6 D 64 21 10 21

68 Hunter3 D 38 80 82 40

69 Theodore3 D 43 7 68 80

72 Luke6 D 15 97 95 99

89 Ezra D 16 56 86 61

94 Aiden D 20 31 62 68), ('E', name team Q1 Q2 Q3 Q4

0 Liver E 89 21 24 64

15 James E 48 77 52 11

19 Max E 97 75 41 3

24 Isaac E 74 23 28 65

26 Teddy E 71 91 21 48

29 Riley E 35 26 59 83

31 Joseph E 67 87 87 93

36 Jaxon E 88 98 19 98

41 Arlo8 E 48 34 52 51

43 Jude E 8 45 13 65

45 Rory9 E 8 12 58 27

55 Zachary E 12 71 85 93

61 Jackson5 E 6 10 15 33

74 Roman E 73 1 25 44

76 Dexter E 73 94 53 20

80 Ryan E 92 70 64 31

82 Finn E 4 1 55 32

90 Leon E 38 60 31 7

98 Eli E 11 74 58 91

99 Ben E 21 43 41 74)]再通过索引得到第一组的数据：

代码语言：javascript复制list(df.groupby('team'))[0][1]此示例中每一组数据的类型都是一个 DataFrame，其他情况下也有可能是 Series。

代码语言：javascript复制type(list(df.groupby('team'))[0][1])代码语言：javascript复制pandas.core.frame.DataFrame（三）通过循环查看各组的名称和组中的数据信息也可以通过循环查看各组的名称和组中的数据信息（每个分组其实形成了一个包含组名和组信息的元组，见上面示例）。

代码语言：javascript复制for group_name,group_info in df.groupby('team'):

print(group_name)

print(group_info.head())代码语言：javascript复制A

name team Q1 Q2 Q3 Q4

2 Ack A 57 60 18 84

7 Lfie A 9 10 99 37

9 Oscar A 77 9 26 67

16 Joshua A 63 4 80 30

17 Henry A 91 15 75 17

name team Q1 Q2 Q3 Q4

6 Acob B 61 95 94 8

10 Leo B 17 4 33 79

11 Logan B 9 89 35 65

14 Thomas B 80 48 56 41

25 Harrison B 89 13 18 75

name team Q1 Q2 Q3 Q4

1 Arry C 36 37 37 57

3 Eorge C 93 96 71 78

5 Harlie C 24 13 87 43

12 Archie C 83 89 59 68

13 Theo C 51 86 87 27

name team Q1 Q2 Q3 Q4

4 Oah D 65 49 61 86

8 Reddie D 64 93 57 72

21 Ethan D 79 45 89 88

23 Mason D 80 96 26 49

27 Finley D 62 73 84 68

name team Q1 Q2 Q3 Q4

0 Liver E 89 21 24 64

15 James E 48 77 52 11

19 Max E 97 75 41 3

24 Isaac E 74 23 28 65

26 Teddy E 71 91 21 48（四）通过get_group()方法直接获得一组数据代码语言：javascript复制df.groupby('team').get_group('E').tail()二、分组再认识The abstract definition of grouping is to provide a mapping of labels to group names

from: https://pandas.pydata.org/pandas-docs/stable/user_guide/groupby.html

分组本质上提供了标签（行索引）到组名的一个映射，利用groups属性可以看到这种多对一的映射关系。

代码语言：javascript复制df.groupby('team').groups代码语言：javascript复制{'A': Int64Index([2, 7, 9, 16, 17, 20, 22, 34, 40, 42, 51, 67, 70, 71, 75, 79, 88], dtype='int64'),

'B': Int64Index([ 6, 10, 11, 14, 25, 30, 35, 38, 39, 50, 53, 56, 58, 60, 64, 77, 78,

83, 84, 85, 92, 93],

dtype='int64'),

'C': Int64Index([ 1, 3, 5, 12, 13, 18, 28, 32, 33, 37, 46, 47, 54, 62, 73, 81, 86,

87, 91, 95, 96, 97],

dtype='int64'),

'D': Int64Index([4, 8, 21, 23, 27, 44, 48, 49, 52, 57, 59, 63, 65, 66, 68, 69, 72,

89, 94],

dtype='int64'),

'E': Int64Index([0, 15, 19, 24, 26, 29, 31, 36, 41, 43, 45, 55, 61, 74, 76, 80, 82,

90, 98, 99],

dtype='int64')}三、分组的执行过程分组的执行过程——Group by: split-apply-combine

split：按照某一原则（groupby字段）进行拆分，相同属性分为一组apply：对拆分后的各组执行相应的转换操作combine：输出汇总转换后的各组结果图片来源：Pandas之超好用的Groupby用法详解(https://zhuanlan.zhihu.com/p/101284491?utm_source=wechat_session)

使用的重点在于 split 和 apply

（一）split阶段：创建分组的常见形式groupby方法的原型：

DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=

【数据处理包Pandas】分组及相关操作

相关推荐

双截龙升龙拳攻略-双截龙比利变身怎么打出暴击伤害

Steam 上的元炁

华泰卫视落地搭建与中东传媒桥梁

聊聊ThoughtWorks面试（郑大版社招）+ PS：应届生简单流程介绍

春天在哪里？听长沙窑为你念首诗

泰剧《我们的秘密》集数介绍

战略合作伙伴

【数据处理包Pandas】分组及相关操作

相关推荐

双截龙升龙拳攻略-双截龙比利变身怎么打出暴击伤害

Steam 上的 元炁

华泰卫视落地 搭建与中东传媒桥梁

聊聊ThoughtWorks面试（郑大版 社招）+ PS：应届生简单流程介绍

春天在哪里？听长沙窑为你念首诗

泰剧《我们的秘密》集数介绍

战略合作伙伴

Steam 上的元炁

华泰卫视落地搭建与中东传媒桥梁

聊聊ThoughtWorks面试（郑大版社招）+ PS：应届生简单流程介绍