使用 Pandas Transform 将列添加到 GroupBy DataFrame
在 pandas 中使用 groupby 操作时,向 GroupBy 添加新列通常很有用结果数据框。实现此目的的一种方法是使用 .map() 函数,如示例中所示。然而,另一种更直接的方法是使用 .transform() 函数。
.transform() 允许我们将函数应用于数据帧中的每个组并返回带有结果的 Series。返回的 Series 将具有与原始数据帧对齐的索引。
为了说明这一点,让我们从提供的数据帧开始:
df = pd.DataFrame({'c': [1, 1, 1, 2, 2, 2, 2], 'type': ['m', 'n', 'o', 'm', 'm', 'n', 'n']})
我们的目标是计算每个c的type值,并添加一个大小为c的列。
g = df.groupby('c')['type'].value_counts().reset_index(name='t')
此代码计算每个组的值并创建一个名为 t 的新列。
要使用 .transform() 添加大小列,我们可以执行以下操作:
g['size'] = df.groupby('c')['type'].transform('size')
.transform('size')将大小函数应用于每个组,该函数返回每个组的大小。生成的 Series 与原始数据帧的索引对齐,允许我们将其作为新列添加到 g.
输出将是一个带有名为 size 的附加列的数据帧:
c type t size 0 1 m 1 3 1 1 n 1 3 2 1 o 1 3 3 2 m 2 4 4 2 n 2 4
使用 .transform() 提供了一种更简洁、更直接的方法,可以从 groupby 聚合将列添加回原始数据帧。
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3