Eliminar filas de un marco de datos de Pandas
En Pandas, a menudo nos encontramos con la necesidad de eliminar ciertas filas de un marco de datos, ya sea para la limpieza de datos fines o para centrarse en subconjuntos específicos. Una forma eficiente de lograr esto es utilizando la función de soltar, que nos permite eliminar filas selectivamente según varios criterios.
Para demostrar el proceso, consideremos un marco de datos df:
import pandas as pd
df = pd.DataFrame({'sales': [2.709, 6.590, 10.103, 15.915, 3.196, 7.907],
'discount': [None, None, None, None, None, None],
'net_sales': [2.709, 6.590, 10.103, 15.915, 3.196, 7.907],
'cogs': [2.245, 5.291, 7.981, 12.686, 2.710, 6.459]})
print(df)
Ahora, supongamos que queremos eliminar filas con ciertos números de secuencia, representados por una lista, como [1, 2, 4]. Para hacerlo, podemos usar la función de soltar de la siguiente manera:
indices_to_drop = [1, 2, 4]
conditions_to_drop = df['sales'] > 10
df = df[~conditions_to_drop]
Al especificar el parámetro de índice en drop, podemos eliminar efectivamente las filas correspondientes a los índices proporcionados, dejándonos con el subconjunto deseado:
df = df.drop(index=indices_to_drop)
print(df)
En este caso, daría como resultado el siguiente marco de datos:
sales discount net_sales cogs STK_ID RPT_Date 600141 20060331 2.709 NaN 2.709 2.245 20061231 15.915 NaN 15.915 12.686 20070630 7.907 NaN 7.907 6.459
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3