Dividir una columna de tuplas en un marco de datos de Pandas
En los marcos de datos de Pandas, dividir una columna que contiene tuplas en varias columnas es una operación común. Para lograr esto, se pueden adoptar los siguientes métodos:
Usando pd.DataFrame(col.tolist())
Este método convierte la columna de tupla en una lista de tuplas y luego crea un nuevo marco de datos a partir de él. El índice del nuevo marco de datos coincide con el del original.
import pandas as pd
# Create a dataframe with a column containing tuples
df = pd.DataFrame({'a': [1, 2], 'b': [(1, 2), (3, 4)]})
# Split the 'b' column into 'b1' and 'b2'
df[['b1', 'b2']] = pd.DataFrame(df['b'].tolist(), index=df.index)
# Print the resulting dataframe
print(df)
Salida:
a b b1 b2 0 1 (1, 2) 1 2 1 2 (3, 4) 3 4
Nota: Usar df['b'].apply(pd.Series) en lugar de pd.DataFrame(df['b'].tolist(), index= df.index) también funciona. Sin embargo, es más lento y requiere más memoria.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3