superando separadores irregulares em pandas read_csv
ao ler dados de arquivos com separadores irregulares, o método Pandas read_csv pode encontrar dificuldades. Ao contrário do método Python Split (), que lida perfeitamente com o espaço em branco, read_csv pode lutar para decifrar dados separados por espaços e guias inconsistentes. Uma abordagem envolve empregar expressões regulares (REGEX). Usando o parâmetro Delimiter em read_csv, você pode especificar um padrão Regex que captura os separadores desejados. Isso permite que você explique combinações de espaços e guias, garantindo a análise precisa. Ao definir o Delim_whitespace para True, os pandas tratarão qualquer espaço em branco (incluindo espaços e guias) como um separador. Isso elimina a necessidade de especificar um padrão regex específico. dados = pd.read_csv ("IRREGULE_SEPARADORES.CSV", Header = Nenhum, delimiter = r "\ S") Impressão (dados) # Saída: # 0 1 2 3 4 # 0 a b c 1 2 # 1 D E F 3 4
Neste caso, Irregular_separators.csv contém colunas separadas por guias, espaços e até combinações de ambos. Ao especificar o padrão regex, read_csv analisa com sucesso os dados e cria um DataFrame. Impressão (dados) # Saída (o mesmo que acima): # 0 1 2 3 4 # 0 a b c 1 2 # 1 D E F 3 4
Aproveitando a flexibilidade dos separadores em read_csv, você pode efetivamente lidar com o espaço em branco irregular nos arquivos de dados e extrair informações significativas para análise.
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3