Pandas GroupBy.apply 方法中的双重打印
Pandas 中的 GroupBy.apply 方法是对行组执行操作的强大工具在数据帧内。但是,当将函数应用于第一组时,会出现意外行为,导致两个打印输出。
在提供的示例中,具有三行的 DataFrame 按“class”列进行分组。将函数“checkit”应用于分组对象时,第一行(“A”)在输出中出现两次。这种行为乍一看可能令人困惑,但这是设计使然。
GroupBy.apply 方法在第一组上调用指定函数两次,以确定返回数据的形状。此信息对于适当组合结果的方法至关重要。
根据所需的结果,还有 GroupBy.apply 的替代方法,可以返回特定数据形状并避免这种双重调用:
如果应用的函数没有副作用(即不修改原始 DataFrame),第一组的双重打印输出通常不是问题。但是,如果防止这种行为至关重要,建议从上面的列表中选择适当的替代方法。
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3