¿Cómo fusionar eficientemente los marcos de datos de Pandas en función de una condición de rango?

Página delantera > Programación > ¿Cómo fusionar eficientemente los marcos de datos de Pandas en función de una condición de rango?

¿Cómo fusionar eficientemente los marcos de datos de Pandas en función de una condición de rango?

Publicado el 2024-11-21

Navegar:557

How to Efficiently Merge Pandas DataFrames Based on a Range Condition?

Unirse por rango en Pandas

En la manipulación de datos con Pandas, una tarea común es fusionar dos marcos de datos en función de una condición de rango. Esto implica identificar las filas en el marco de datos A donde los valores de una columna específica se encuentran dentro de un rango específico en el marco de datos B.

Un enfoque para esta tarea implica crear una columna ficticia en ambos marcos de datos, realizando una unión cruzada usando esta columna ficticia y luego filtrar las filas que no cumplen con los criterios de rango. Sin embargo, este método puede ser ineficiente para conjuntos de datos grandes.

Una solución alternativa es utilizar numpy broadcasting, que es una técnica poderosa para realizar operaciones de elementos en matrices. Al convertir las columnas relevantes en los marcos de datos A y B en matrices numpy, podemos aplicar operadores lógicos para comparar el valor A con los valores B_low y B_high para identificar las filas que satisfacen la condición de rango.

import numpy as np

# Convert to numpy arrays
a = A.A_value.values
bh = B.B_high.values
bl = B.B_low.values

# Find intersecting indices
i, j = np.where((a[:, None] >= bl) & (a[:, None] Este método ofrece una mayor eficiencia para conjuntos de datos grandes en comparación con el enfoque de columnas ficticias. Además, permite una fácil implementación de uniones izquierda o derecha ajustando la lógica en el paso de transmisión numpy.

Último tutorial Más>

¿Cómo cargar archivos con parámetros adicionales utilizando java.net.urlconnection y codificación multipart/formulario?
de carga de archivos con solicitudes http para cargar archivos a un servidor HTTP al tiempo que envía parámetros adicionales, java.net.urlconn...

Programación Publicado el 2025-04-07
¿Cómo usar correctamente las consultas como los parámetros PDO?
usando consultas similares en pdo al intentar implementar una consulta similar en PDO, puede encontrar problemas como el que se describe en la...

Programación Publicado el 2025-04-07
¿Cómo puedo iterar e imprimir sincrónicamente los valores de dos matrices de igual tamaño en PHP?
iterando e imprimiendo los valores de dos matrices del mismo tamaño cuando se crea un Selectbox usando dos matrices de igual tamaño, uno que con...

Programación Publicado el 2025-04-07
¿Cómo analizar las matrices JSON en ir usando el paquete `JSON`?
Parsing Json Matray en Go con el paquete JSON Problema: ¿Cómo puede analizar una cadena JSON que representa una matriz en ir usando el paque...

Programación Publicado el 2025-04-07
¿Cómo puedo ejecutar múltiples declaraciones SQL en una sola consulta usando nodo-mysql?
múltiple consulta de consulta en nodo-mysql en node.js, la pregunta surge al ejecutar múltiples estaciones sql en una sola consulta utilizando...

Programación Publicado el 2025-04-07
¿Cómo mostrar correctamente la fecha y hora actuales en el formato "DD/MM/YYYY HH: MM: SS.SS" en Java?
cómo mostrar la fecha y la hora actuales en "dd/mm/aa radica en el uso de diferentes instancias de SimpleFormat con diferentes patrones de f...

Programación Publicado el 2025-04-07
¿Necesito eliminar explícitamente las asignaciones de montón en C ++ antes de la salida del programa?
deleción explícita en c a pesar de la salida del programa cuando trabajan con la asignación de memoria dinámica en c, los desarrolladores a me...

Programación Publicado el 2025-04-07
¿Puedo migrar mi cifrado de MCRYPT a OpenSSL y descifrar datos cifrados de MCRYPT usando OpenSSL?
actualizando mi biblioteca de cifrado de MCRYP En OpenSSL, ¿es posible descifrar datos encriptados con MCRYPT? Dos publicaciones diferentes propo...

Programación Publicado el 2025-04-07
¿Puedes usar CSS para la salida de la consola de color en Chrome y Firefox?
que muestra los colores en la console JavaScript es posible usar la consola de Chrome para mostrar texto coloreado, como rojo para errores, na...

Programación Publicado el 2025-04-07
¿Cómo puedo unir tablas de bases de datos con diferentes números de columnas?
tablas combinadas con diferentes columnas ]] puede encontrar desafíos al intentar fusionar las tablas de la base de datos con diferentes column...

Programación Publicado el 2025-04-07
¿Cómo recuperar la última biblioteca jQuery de Google API?
recuperando la última biblioteca jQuery de Google APIS La URL de jQuery proporcionada en la pregunta es para la versión 1.2.6. Para recuperar ...

Programación Publicado el 2025-04-07
¿Cómo convertir eficientemente las zonas horarias en PHP?
Conversión de zona horaria eficiente en php en PHP, el manejo de las zonas horarias puede ser una tarea directa. Esta guía proporcionará un méto...

Programación Publicado el 2025-04-07
¿Cómo puedo recuperar eficientemente los valores de atributos de los archivos XML usando PHP?
Recuperando valores de atributo de archivos XML en php Todo desarrollador encuentra la necesidad de analizar archivos XML y extraer valores es...

Programación Publicado el 2025-04-07
¿Cómo capturar y transmitir stdout en tiempo real para la ejecución del comando de chatbot?
capturando stdout en tiempo real desde la ejecución de comandos en el reino de desarrollar chatbots capaces de ejecutar comandos, un requisito...

Programación Publicado el 2025-04-07
¿Cómo implementar una función hash genérica para tuplas en colecciones desordenadas?
Función hash genérica para tuplas en colecciones no ordenadas los contenedores std :: unordened_map y std :: unordened_set proporcionan una mi...

Programación Publicado el 2025-04-07

Clasificación Más>

Aprende japonés Aprender coreano Aprender chino Aprender idioma extranjero Juego Problema comun Periféricos tecnológicos AI Tutoriales de software Programación Artículo