dividindo as seqüências de dados do quadro de dados separados por vírgula em linhas separadas
em pandas dados de dados, é frequentemente encontrado que um ou mais colunas contém valores coma-separados (CSV) Para conseguir isso, várias abordagens podem ser empregadas:
usando séries.explode () ou dataframe.explode () :
Este método está disponível em pandas 0.25.0 e acima e é projetado especificamente para explodir a lista de explosões que explodem-se-exploradas. Columns. lst_cols, FILL_VALUE = '', preserve_index = false): # ... (Detalhes da implementação)
df.explode('column_name')convertendo strings CSV para listas
: se o objetivo é apenas para converter strings csv em listas, isso pode ser alcançado por dividir as strings usando str.split (). df ['var1']. str.split (',')
abordagem vetorizada personalizada
def explode(df, lst_cols, fill_value='', preserve_index=False): # ... (implementation details)
Essa abordagem pode lidar com várias colunas, incluindo colunas normais e listões. col: np.Repeat (x [col] .Values, x [lst_col] .st.len ()) para col em x.columns.difference ([lst_col]) }). Atribuído (** {lst_col: np.concatenate (x [lst_col] .Values)}) [x.columns.tolist ()]
Legacy Solution: (&& &&s .reset_index () para dividir as cordas do CSV e empilhá-las em linhas individuais.
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3