"Si un trabajador quiere hacer bien su trabajo, primero debe afilar sus herramientas." - Confucio, "Las Analectas de Confucio. Lu Linggong"
Página delantera > Programación > ¿Cómo dividir una columna de tuplas en varias columnas en un marco de datos de Pandas?

¿Cómo dividir una columna de tuplas en varias columnas en un marco de datos de Pandas?

Publicado el 2024-11-11
Navegar:637

How to Split a Column of Tuples into Multiple Columns in a Pandas DataFrame?

Dividir una columna de tuplas en un marco de datos de Pandas

En los marcos de datos de Pandas, dividir una columna que contiene tuplas en varias columnas es una operación común. Para lograr esto, se pueden adoptar los siguientes métodos:

Usando pd.DataFrame(col.tolist())

Este método convierte la columna de tupla en una lista de tuplas y luego crea un nuevo marco de datos a partir de él. El índice del nuevo marco de datos coincide con el del original.

import pandas as pd

# Create a dataframe with a column containing tuples
df = pd.DataFrame({'a': [1, 2], 'b': [(1, 2), (3, 4)]})

# Split the 'b' column into 'b1' and 'b2'
df[['b1', 'b2']] = pd.DataFrame(df['b'].tolist(), index=df.index)

# Print the resulting dataframe
print(df)

Salida:

   a  b  b1  b2
0  1  (1, 2)   1   2
1  2  (3, 4)   3   4

Nota: Usar df['b'].apply(pd.Series) en lugar de pd.DataFrame(df['b'].tolist(), index= df.index) también funciona. Sin embargo, es más lento y requiere más memoria.

Último tutorial Más>

Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.

Copyright© 2022 湘ICP备2022001581号-3