Dividindo uma coluna de tuplas em um DataFrame do Pandas
Em dataframes do Pandas, dividir uma coluna contendo tuplas em várias colunas é uma operação comum. Para conseguir isso, pode-se adotar os seguintes métodos:
Usando pd.DataFrame(col.tolist())
Este método converte a coluna da tupla em uma lista de tuplas e então cria um novo dataframe a partir dele. O índice do novo dataframe corresponde ao do original.
import pandas as pd
# Create a dataframe with a column containing tuples
df = pd.DataFrame({'a': [1, 2], 'b': [(1, 2), (3, 4)]})
# Split the 'b' column into 'b1' and 'b2'
df[['b1', 'b2']] = pd.DataFrame(df['b'].tolist(), index=df.index)
# Print the resulting dataframe
print(df)
Saída:
a b b1 b2 0 1 (1, 2) 1 2 1 2 (3, 4) 3 4
Nota: Usando df['b'].apply(pd.Series) em vez de pd.DataFrame(df['b'].tolist(), index= df.index) também funciona. No entanto, é mais lento e requer mais memória.
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3