Como mesclar dataframes do Pandas com eficiência com base em uma condição de intervalo?

Primeira página > Programação > Como mesclar dataframes do Pandas com eficiência com base em uma condição de intervalo?

Como mesclar dataframes do Pandas com eficiência com base em uma condição de intervalo?

Publicado em 2024-11-21

Navegar:137

How to Efficiently Merge Pandas DataFrames Based on a Range Condition?

Junção por intervalo no Pandas

Na manipulação de dados usando o Pandas, uma tarefa comum é mesclar dois dataframes com base em uma condição de intervalo. Isso envolve identificar as linhas no dataframe A onde os valores em uma coluna específica estão dentro de um intervalo especificado no dataframe B.

Uma abordagem para esta tarefa envolve a criação de uma coluna fictícia em ambos os dataframes, realizando uma junção cruzada usando esta coluna fictícia e, em seguida, filtrando as linhas que não atendem aos critérios de intervalo. No entanto, este método pode ser ineficiente para grandes conjuntos de dados.

Uma solução alternativa é utilizar a transmissão numpy, que é uma técnica poderosa para realizar operações elemento a elemento em matrizes. Ao converter as colunas relevantes nos dataframes A e B em matrizes numpy, podemos aplicar operadores lógicos para comparar A_value com os valores B_low e B_high para identificar as linhas que satisfazem a condição de intervalo.

import numpy as np

# Convert to numpy arrays
a = A.A_value.values
bh = B.B_high.values
bl = B.B_low.values

# Find intersecting indices
i, j = np.where((a[:, None] >= bl) & (a[:, None] Este método oferece maior eficiência para grandes conjuntos de dados em comparação com a abordagem de coluna fictícia. Além disso, permite fácil implementação de junções à esquerda ou à direita, ajustando a lógica na etapa de transmissão numpy.

Tutorial mais recente Mais>

Qual método para declarar várias variáveis em JavaScript é mais sustentável?
declarando várias variáveis em javascript: explorando dois métodos em javascript, os desenvolvedores geralmente encontram a necessidade de d...

Programação Postado em 2025-04-07
Como definir dinamicamente as teclas em objetos JavaScript?
como criar uma chave dinâmica para uma variável de objeto JavaScript ao tentar criar uma chave dinâmica para um objeto JavaScript, usando essa s...

Programação Postado em 2025-04-07
Como posso executar comandos de prompt de comando, incluindo alterações de diretório, em java?
Executar comandos do prompt de comando em java Problema: executando comandos de prompt de java pode ser desafio. Embora você possa encontr...

Programação Postado em 2025-04-07
$Como resolver o erro \ "Uso inválido da função do grupo \" no MySQL ao encontrar a contagem máxima?$
Como resolver o erro \ "Uso inválido da função do grupo \" no MySQL ao encontrar a contagem máxima?
como recuperar a contagem máxima usando o mysql em mysql, você pode encontrar um problema enquanto tenta encontrar a contagem máxima de valore...

Programação Postado em 2025-04-07
Como superar as restrições de redefinição da função do PHP?
superando a função do PHP Redefinição limitações em php, definir uma função com o mesmo nome várias vezes é um não-no. Tentar fazê -lo, como v...

Programação Postado em 2025-04-07
Como posso lidar com os nomes de arquivos UTF-8 nas funções do sistema de arquivos do PHP?
lidando com utf-8 nomes de arquivos nas funções do sistema de arquivos do PHP Ao criar pastas que contêm caracteres utf-8 usando a função mkdi...

Programação Postado em 2025-04-07
Eval () vs. AST.LITERAL_EVAL (): Qual função Python é mais segura para a entrada do usuário?
pesando avaliação () e ast.literal_eval () na python Security Ao lidar com a entrada do usuário, é imperativo priorizar a segurança. Eval (), ...

Programação Postado em 2025-04-07
Como posso ler com eficiência um arquivo grande em ordem inversa usando o Python?
lendo um arquivo em ordem inversa em python se você estiver trabalhando com um arquivo grande e precisar ler seus conteúdos da última linha pa...

Programação Postado em 2025-04-07
Posso migrar minha criptografia de McRypt para OpenSSL e descriptografar dados criptografados por McRypt usando o OpenSSL?
Atualizando minha biblioteca de criptografia de McRypt para OpenSSL posso atualizar minha biblioteca de criptografia de McHRPT para openssl? N...

Programação Postado em 2025-04-07
$\ "while (1) vs. para (;;): a otimização do compilador elimina as diferenças de desempenho? \"$
\ "while (1) vs. para (;;): a otimização do compilador elimina as diferenças de desempenho? \"
while (1) vs. for (;;): existe uma diferença de velocidade? loops? Resposta: Na maioria dos compiladores modernos, não há diferença de dese...

Programação Postado em 2025-04-07
Como implementar uma função de hash genérico para tuplas em coleções não ordenadas?
função de hash genérico para tuplas em coleções não ordenadas o std :: não -ordered_map e std :: uncomered_set contêineres fornecem pesquisa e...

Programação Postado em 2025-04-07
Como você extrai um elemento aleatório de uma matriz no PHP?
seleção aleatória de uma matriz em php, a obtenção de um item aleatório de uma matriz pode ser realizado com ease. Considere a seguinte matriz: ...

Programação Postado em 2025-04-07
Vários elementos pegajosos podem ser empilhados um no outro em CSS puro?
É possível ter vários elementos pegajosos empilhados um no outro em CSS puro? O comportamento desejado pode ser visto Aqui: https://webtheme...

Programação Postado em 2025-04-07
Como o Android envia dados de postagem para o servidor PHP?
enviando dados de postagem em Android introdução este artigo aborda a necessidade de enviar dados post para um script php e exibir o resul...

Programação Postado em 2025-04-07
Como limitar o intervalo de rolagem de um elemento dentro de um elemento pai de tamanho dinâmico?
implementando limites de altura CSS para elementos de rolagem vertical em uma interface interativa, o controle do comportamento de rolagem dos...

Programação Postado em 2025-04-07

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo