Двойная распечатка в Pandas Метод GroupBy.apply
Метод GroupBy.apply в Pandas — мощный инструмент для выполнения операций над группами строк внутри DataFrame. Однако при применении функции к первой группе происходит неожиданное поведение, что приводит к двум распечаткам.
В приведенном примере DataFrame с тремя строками сгруппирован по столбцу «класс». При применении функции «checkit» к сгруппированному объекту первая строка («A») появляется в выходных данных дважды. Поначалу такое поведение может показаться запутанным, но оно так задумано.
Метод GroupBy.apply дважды вызывает указанную функцию в первой группе, чтобы определить форму возвращаемых данных. Эта информация имеет решающее значение для того, чтобы метод мог правильно объединить результаты.
В зависимости от желаемого результата существуют альтернативные методы GroupBy.apply, которые возвращают определенные фигуры данных и избегают этого двойного вызова:
Если примененная функция не имеет побочных эффектов (т. е. не изменяет исходный DataFrame), двойная распечатка в первой группе обычно не вызывает беспокойства. Однако, если крайне важно предотвратить такое поведение, рекомендуется выбрать подходящий альтернативный метод из приведенного выше списка.
Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3