"Se um trabalhador quiser fazer bem o seu trabalho, ele deve primeiro afiar suas ferramentas." - Confúcio, "Os Analectos de Confúcio. Lu Linggong"
Primeira página > Programação > Por que você deve sempre copiar DataFrames do Pandas ao selecionar subconjuntos?

Por que você deve sempre copiar DataFrames do Pandas ao selecionar subconjuntos?

Publicado em 19/11/2024
Navegar:617

Why Should You Always Copy Pandas DataFrames When Selecting Subsets?

Compreendendo a importância da cópia de quadros de dados no Pandas

No Pandas, ao selecionar uma parte de um quadro de dados, é prática comum usar o '.copy() 'método para criar uma cópia do quadro de dados original. Essa abordagem garante que quaisquer alterações feitas no subconjunto não afetarão o quadro de dados pai.

Por que fazer uma cópia?

Por padrão, a indexação de um quadro de dados retorna um visualização do quadro de dados original, em vez de uma cópia. Isso significa que quaisquer modificações feitas no subconjunto afetarão diretamente o quadro de dados pai. Para manter a integridade do quadro de dados pai, é essencial criar uma cópia usando o método '.copy()'.

Consequências de não copiar

Considere o seguinte trecho de código:

df = pd.DataFrame({'x': [1, 2]})
df_sub = df.iloc[0:1]
df_sub.x = -1

Neste exemplo, df_sub é uma visualização de df. Como resultado, definir df_sub.x como -1 também modifica df.x:

print(df)
   x
0 -1
1  2

Benefícios da cópia

A cópia de quadros de dados garante que o quadro de dados pai permaneça intacto. Isto é particularmente importante quando múltiplas operações são executadas em um quadro de dados e é crucial preservar os dados originais para análise ou comparação posterior.

df_sub_copy = df.iloc[0:1].copy()
df_sub_copy.x = -1

print(df)
   x
0  1
1  2

Neste trecho de código modificado, df_sub_copy é uma cópia de df. Como resultado, alterar df_sub_copy.x não tem impacto no df.

Nota: É importante observar que o comportamento da indexação de quadros de dados mudou nas versões mais recentes do Pandas. No Pandas 1.0 e versões anteriores, a indexação de um quadro de dados retorna uma cópia por padrão. No entanto, no Pandas 1.1 e posteriores, a indexação retorna uma visualização. Para garantir um comportamento consistente entre versões, é recomendado sempre usar o método '.copy()' ao criar subconjuntos de quadros de dados.

Tutorial mais recente Mais>

Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.

Copyright© 2022 湘ICP备2022001581号-3