¿Son realmente malos los bucles for en pandas? ¿Cuándo debería importarme?
Introducción
Si bien pandas es conocido por sus operaciones vectorizadas que aceleran el cálculo, muchos ejemplos de código todavía incluyen bucles. Si bien la documentación sugiere evitar la iteración sobre los datos, esta publicación explora escenarios donde los bucles for ofrecen un mejor rendimiento que los enfoques vectorizados.
Iteración versus vectorización en datos pequeños
Para En el caso de datos pequeños, los bucles for pueden superar a las funciones vectorizadas debido a la sobrecarga que implica el manejo de estas últimas de la alineación de los ejes, los tipos de datos mixtos y los datos faltantes. Las listas por comprensión, que emplean mecanismos iterativos optimizados, son incluso más rápidas.
Operaciones con tipos de objetos/mixtos
Comparación basada en cadenas:
Operaciones Regex
Cuándo considerar los bucles for
La iteración es más rápida que las funciones vectorizadas debido a la reducción de la sobrecarga.
Mixta tipos de datos:
Expresiones regulares:
Conclusión
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3