A busca pelo desempenho, parte II: Perl vs Python

Primeira página > Programação > A busca pelo desempenho, parte II: Perl vs Python

A busca pelo desempenho, parte II: Perl vs Python

Publicado em 01/08/2024

Navegar:190

The Quest for Performance Part II : Perl vs Python

Tendo apresentado um exemplo de desempenho de brinquedo, agora faremos uma pequena digressão e compararemos o desempenho com
algumas implementações Python. Primeiro vamos preparar o cenário para os cálculos e fornecer a linha de comando
recursos para o script Python.

import argparse
import time
import math
import numpy as np
import os
from numba import njit
from joblib import Parallel, delayed

parser = argparse.ArgumentParser()
parser.add_argument("--workers", type=int, default=8)
parser.add_argument("--arraysize", type=int, default=100_000_000)
args = parser.parse_args()
# Set the number of threads to 1 for different libraries
print("=" * 80)
print(
    f"\nStarting the benchmark for {args.arraysize} elements "
    f"using {args.workers} threads/workers\n"
)

# Generate the data structures for the benchmark
array0 = [np.random.rand() for _ in range(args.arraysize)]
array1 = array0.copy()
array2 = array0.copy()
array_in_np = np.array(array1)
array_in_np_copy = array_in_np.copy()

E aqui estão nossos concorrentes:

Python básico

  for i in range(len(array0)):
    array0[i] = math.cos(math.sin(math.sqrt(array0[i])))

Numpy (thread único)

np.sqrt(array_in_np, out=array_in_np)
np.sin(array_in_np, out=array_in_np)
np.cos(array_in_np, out=array_in_np)

Joblib (observe que este exemplo não é verdadeiro no local, mas não consegui executá-lo usando os argumentos out)

def compute_inplace_with_joblib(chunk):
    return np.cos(np.sin(np.sqrt(chunk))) #parallel function for joblib

chunks = np.array_split(array1, args.workers)  # Split the array into chunks
numresults = Parallel(n_jobs=args.workers)(
        delayed(compute_inplace_with_joblib)(chunk) for chunk in chunks
    )# Process each chunk in a separate thread
array1 = np.concatenate(numresults)  # Concatenate the results

Numba

@njit
def compute_inplace_with_numba(array):
    np.sqrt(array,array)
    np.sin(array,array)
    np.cos(array,array)
    ## njit will compile this function to machine code
compute_inplace_with_numba(array_in_np_copy)

E aqui estão os resultados do tempo:

In place in (  base Python): 11.42 seconds
In place in (Python Joblib): 4.59 seconds
In place in ( Python Numba): 2.62 seconds
In place in ( Python Numpy): 0.92 seconds

O numba é surpreendentemente mais lento!? Poderia ser devido à sobrecarga de compilação, conforme apontado por mohawk2 em uma troca de IRC sobre esse assunto?
Para testar isso, devemos chamar computate_inplace_with_numba uma vez antes de executarmos o benchmark. Fazer isso mostra que Numba agora é mais rápido que Numpy.

In place in (  base Python): 11.89 seconds
In place in (Python Joblib): 4.42 seconds
In place in ( Python Numpy): 0.93 seconds
In place in ( Python Numba): 0.49 seconds

Finalmente, decidi usar a base R para passeio no mesmo exemplo:

que produziu o seguinte resultado de tempo:

Time in base R: 1.30 seconds

Em comparação com os resultados Perl, observamos o seguinte sobre este exemplo:

As operações Inplace no Python base eram ~ 3,5 mais lentas do que Perl
PDL de thread único e numpy forneceram resultados quase idênticos, seguidos de perto pelo R básico
A falha em levar em conta a sobrecarga de compilação do Numba produz a falsa impressão de que ele é mais lento que o Numpy. Ao contabilizar a sobrecarga de compilação, Numba é x2 mais rápido que Numpy
A paralelização com Joblib melhorou em relação ao Python básico, mas ainda era inferior à implementação Perl de thread único
PDL multithread (e OpenMP) esmagou (não travou!) todas as outras implementações em todos os idiomas). Espero que esta postagem fornece algum alimento para reflexão o idioma a ser usado em sua próxima operação intensiva de dados/computação. A próxima parte desta série examinará o mesmo exemplo usando arrays em C. Esta parte final irá (esperançosamente) fornecer alguns insights sobre o impacto da localidade da memória e a sobrecarga incorrida pelo uso de linguagens de tipo dinâmico.

Declaração de lançamento Este artigo foi reproduzido em: https://dev.to/chrisarg/the-quest-for-performance-part-ii-perl-vs-python-5gdg?1 Se houver alguma violação, entre em contato com [email protected] para excluí-lo

Tutorial mais recente Mais>

O Java permite vários tipos de retorno: uma olhada mais próxima dos métodos genéricos?
Tipos de retorno múltiplos em java: um equívoco revelado no reino da programação java, e um método peculiar pode surgir, deixando os desenvolv...

Programação Postado em 2025-04-24
Como limitar o intervalo de rolagem de um elemento dentro de um elemento pai de tamanho dinâmico?
implementando limites de altura CSS para elementos de rolagem vertical em uma interface interativa, o controle do comportamento de rolagem dos...

Programação Postado em 2025-04-24
Como posso lidar com os nomes de arquivos UTF-8 nas funções do sistema de arquivos do PHP?
lidando com utf-8 nomes de arquivos nas funções do sistema de arquivos do PHP Ao criar pastas que contêm caracteres utf-8 usando a função mkdi...

Programação Postado em 2025-04-24
$\ "while (1) vs. para (;;): a otimização do compilador elimina as diferenças de desempenho? \"$
\ "while (1) vs. para (;;): a otimização do compilador elimina as diferenças de desempenho? \"
while (1) vs. for (;;): existe uma diferença de velocidade? loops? Resposta: Na maioria dos compiladores modernos, não há diferença de dese...

Programação Postado em 2025-04-24
Como analisar as matrizes json em Go usando o pacote `json`?
analisando as matrizes json em go com o pacote json Problem: como você pode analisar uma string json representando um array em Go usando o p...

Programação Postado em 2025-04-24
Como posso selecionar programaticamente todo o texto dentro de uma div em mouse clique?
selecionando programaticamente o texto div no mouse click question dado um elemento Div com conteúdo de texto, como o usuário pode selecionar ...

Programação Postado em 2025-04-24
Preciso excluir explicitamente as alocações de heap em C ++ antes da saída do programa?
exclusão explícita em c, apesar do programa exit ao trabalhar com a alocação de memória dinâmica em C, os desenvolvedores geralmente se pergun...

Programação Postado em 2025-04-24
Como corrigir “Erro geral: o servidor MySQL 2006 desapareceu” ao inserir dados?
Como resolver "Erro geral: o servidor MySQL de 2006 desapareceu" ao inserir registrosIntrodução:A inserção de dados em um banco de dados MyS...

Programação Postado em 2025-04-24
Tags de formatação HTML
Elementos de formatação HTML **HTML Formatting is a process of formatting text for better look and feel. HTML provides us ability to form...

Programação Postado em 2025-04-24
Objetos-ajuste: a capa falha no IE e na borda, como consertar?
object-fit: a capa falha no ie e borda, como corrigir? utilizando objeto-fit: cover; No CSS, para manter a altura consistente da imagem funcio...

Programação Postado em 2025-04-24
Como remover emojis das cordas em Python: um guia para iniciantes para corrigir erros comuns?
removendo os emojis de strings em python o código Python fornecido para remover emojis falha porque contém syntaxe erros. As cadeias de unicod...

Programação Postado em 2025-04-24
Por que não `corpo {margem: 0; } `Sempre remova a margem superior no CSS?
abordando a remoção da margem corporal em css para desenvolvedores da web iniciantes, remover a margem do elemento corporal pode ser uma taref...

Programação Postado em 2025-04-24
Como posso recuperar com eficiência valores de atributo de arquivos XML usando PHP?
recuperando valores do atributo dos arquivos xml em php todo desenvolvedor encontra a necessidade de analisar arquivos xml e extrair valores e...

Programação Postado em 2025-04-24
Como converter com eficiência fusos horários em PHP?
Conversão eficiente do fuso horário em php No PHP, o manuseio dos fusos horários pode ser uma tarefa direta. Este guia fornecerá um método fácil...

Programação Postado em 2025-04-24
Como posso manter a renderização de células JTable personalizada após a edição de células?
MANAZENDO JTABLE CELUMENTE renderização após a célula edit em uma jtable, implementar capacidades de renderização e edição de células personal...

Programação Postado em 2025-04-24

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo