性能追求第二部分：Perl 与 Python

发布于2024-08-01

The Quest for Performance Part II : Perl vs Python

运行了一个玩具性能示例后，我们现在将稍微偏离主题并将性能与
进行对比一些 Python 实现。首先让我们设置计算阶段，并提供命令行
Python 脚本的功能。

import argparse
import time
import math
import numpy as np
import os
from numba import njit
from joblib import Parallel, delayed

parser = argparse.ArgumentParser()
parser.add_argument("--workers", type=int, default=8)
parser.add_argument("--arraysize", type=int, default=100_000_000)
args = parser.parse_args()
# Set the number of threads to 1 for different libraries
print("=" * 80)
print(
    f"\nStarting the benchmark for {args.arraysize} elements "
    f"using {args.workers} threads/workers\n"
)

# Generate the data structures for the benchmark
array0 = [np.random.rand() for _ in range(args.arraysize)]
array1 = array0.copy()
array2 = array0.copy()
array_in_np = np.array(array1)
array_in_np_copy = array_in_np.copy()

这是我们的参赛者：

基础Python

  for i in range(len(array0)):
    array0[i] = math.cos(math.sin(math.sqrt(array0[i])))

Numpy（单线程）

np.sqrt(array_in_np, out=array_in_np)
np.sin(array_in_np, out=array_in_np)
np.cos(array_in_np, out=array_in_np)

Joblib（请注意，这个示例不是真正的就地示例，但我无法使用 out 参数使其运行）

def compute_inplace_with_joblib(chunk):
    return np.cos(np.sin(np.sqrt(chunk))) #parallel function for joblib

chunks = np.array_split(array1, args.workers)  # Split the array into chunks
numresults = Parallel(n_jobs=args.workers)(
        delayed(compute_inplace_with_joblib)(chunk) for chunk in chunks
    )# Process each chunk in a separate thread
array1 = np.concatenate(numresults)  # Concatenate the results

努巴

@njit
def compute_inplace_with_numba(array):
    np.sqrt(array,array)
    np.sin(array,array)
    np.cos(array,array)
    ## njit will compile this function to machine code
compute_inplace_with_numba(array_in_np_copy)

以下是计时结果：

In place in (  base Python): 11.42 seconds
In place in (Python Joblib): 4.59 seconds
In place in ( Python Numba): 2.62 seconds
In place in ( Python Numpy): 0.92 seconds

numba 出奇的慢！？这是否是由于 mohawk2 在 IRC 交流中关于此问题所指出的编译开销所致？
为了测试这一点，我们应该在执行基准测试之前调用compute_inplace_with_numba一次。这样做表明 Numba 现在比 Numpy 更快。

到位（基本Python）：11.89秒到位（Python Joblib）：4.42秒到位（Python Numpy）：0.93 秒到位（Python Numba）：0.49 秒

In place in (  base Python): 11.89 seconds
In place in (Python Joblib): 4.42 seconds
In place in ( Python Numpy): 0.93 seconds
In place in ( Python Numba): 0.49 seconds

最后，我决定在同一个例子中使用基础 R 进行骑行：

nIn place in ( base Python): 11.89 seconds In place in (Python Joblib): 4.42 seconds In place in ( Python Numpy): 0.93 seconds In place in ( Python Numba): 0.49 seconds 产生以下计时结果：

R基地时间：1.30秒

In place in (  base Python): 11.89 seconds
In place in (Python Joblib): 4.42 seconds
In place in ( Python Numpy): 0.93 seconds
In place in ( Python Numba): 0.49 seconds

与 Perl 结果相比，我们注意到此示例的以下内容：

慢约 3.5 单线程 PDL 和 numpy 给出了几乎相同的结果，紧随其后的是基础 R
未能考虑 Numba 的编译开销会产生
它比 Numpy 慢的印象。考虑到编译开销时，Numba 比 Numpy 快 2 倍 Joblib 的并行化确实改进了基础 Python，但仍然不如单线程 Perl 实现
多线程 PDL（和 OpenMP）碾压（不是崩溃！）所有语言中的所有其他实现。希望这个帖子提供了一些值得思考的东西用于下一次数据/计算密集型操作的语言。本系列的下一部分将研究在 C 中使用数组的相同示例。最后一部分将（希望）提供有关内存局部性的影响以及使用动态类型语言所产生的开销的一些见解。

版本声明本文转载于：https://dev.to/chrisarg/the-quest-for-performance-part-ii-perl-vs-python-5gdg?1如有侵犯，请联系[email protected]删除

最新教程更多>

如何干净地删除匿名JavaScript事件处理程序？
删除匿名事件侦听器将匿名事件侦听器添加到元素中会提供灵活性和简单性，但是当要删除它们时，可以构成挑战，而无需替换元素本身就可以替换一个问题。 element？ element.addeventlistener（event，function（）{/在这里工作/}，false）; 要解决此问题，请考虑...

编程发布于2025-07-10
CSS可以根据任何属性值来定位HTML元素吗？
靶向html元素，在CSS 中使用任何属性值，在CSS中，可以基于特定属性（如下所示）基于特定属性的基于特定属性的emants目标元素：字体家庭：康斯拉斯（Consolas）； } 但是，出现一个常见的问题：元素可以根据任何属性值而定位吗？本文探讨了此主题。的目标元素有任何任何属性值，属...

编程发布于2025-07-10
`console.log`显示修改后对象值异常的原因
foo = [{id：1}，{id：2}，{id：3}，{id：4}，{id：id：5}，]，]; console.log（'foo1'，foo，foo.length）; foo.splice（2，1）; console.log('foo2', foo, foo....

编程发布于2025-07-10
如何从PHP中的Unicode字符串中有效地产生对URL友好的sl。
为有效的slug生成首先，该函数用指定的分隔符替换所有非字母或数字字符。此步骤可确保slug遵守URL惯例。随后，它采用ICONV函数将文本简化为us-ascii兼容格式，从而允许更广泛的字符集合兼容性。接下来，该函数使用正则表达式删除了不需要的字符，例如特殊字符和空格。此步骤可确保slug仅包含...

编程发布于2025-07-10
Go语言如何动态发现导出包类型？
与反射软件包中的有限类型的发现能力相反，本文探索了替代方法，探索了在Runruntime。go import（ “ FMT” “去/进口商” ） func main（）{ pkg，err：= incorter.default（）。导入（“ time”）如果err...

编程发布于2025-07-10
为什么使用Firefox后退按钮时JavaScript执行停止？
导航历史记录问题：JavaScript使用Firefox Back Back 此行为是由浏览器缓存JavaScript资源引起的。要解决此问题并确保在后续页面访问中执行脚本，Firefox用户应设置一个空功能。警报'）; }; alert（'inline Alert'）...

编程发布于2025-07-10
PHP阵列键值异常：了解07和08的好奇情况
PHP数组键值问题，使用07&08 在给定数月的数组中，键值07和08呈现令人困惑的行为时，就会出现一个不寻常的问题。运行print_r（$月）返回意外结果：键“ 07”丢失，而键“ 08”分配给了9月的值。此问题源于PHP对领先零的解释。当一个数字带有0（例如07或08）的前缀时，PHP将其...

编程发布于2025-07-10
如何限制动态大小的父元素中元素的滚动范围？
在交互式接口中实现垂直滚动元素的CSS高度限制，控制元素的滚动行为对于确保用户体验和可访问性是必不可少的。一种这样的方案涉及限制动态大小的父元素中元素的滚动范围。问题：考虑一个布局，其中我们具有与用户垂直滚动一起移动的可滚动地图div，同时与固定的固定sidebar保持一致。但是，地图的滚动无限期...

编程发布于2025-07-10
可以在纯CS中将多个粘性元素彼此堆叠在一起吗？
[2这里： https：//webthemez.com/demo/sticky-multi-header-scroll/index.html </main> <section> { display：grid; grid-template-...

编程发布于2025-07-10
同实例无需转储复制MySQL数据库方法
在同一实例上复制一个MySQL数据库而无需转储在同一mySQL实例上复制数据库，而无需创建InterMediate sqql script。以下方法为传统的转储和IMPORT过程提供了更简单的替代方法。直接管道数据 MySQL手动概述了一种允许将mysqldump直接输出到MySQL clie...

编程发布于2025-07-10
eval（）vs. ast.literal_eval（）：对于用户输入，哪个Python函数更安全？
称量（）和ast.literal_eval（）中的Python Security 在使用用户输入时，必须优先确保安全性。强大的Python功能Eval（）通常是作为潜在解决方案而出现的，但担心其潜在风险。 This article delves into the differences betwee...

编程发布于2025-07-10
Go语言垃圾回收如何处理切片内存？
Garbage Collection in Go Slices: A Detailed AnalysisIn Go, a slice is a dynamic array that references an underlying array.使用切片时，了解垃圾收集行为至关重要，以避免潜在的内存泄...

编程发布于2025-07-10
如何为PostgreSQL中的每个唯一标识符有效地检索最后一行？
postgresql：为每个唯一标识符在postgresql中提取最后一行，您可能需要遇到与数据集合中每个不同标识的信息相关的信息。考虑以下数据：[ 1 2014-02-01 kjkj 在数据集中的每个唯一ID中检索最后一行的信息，您可以在操作员上使用Postgres的有效效率： id dat...

编程发布于2025-07-10
在细胞编辑后，如何维护自定义的JTable细胞渲染？
在JTable中维护jtable单元格渲染后，在JTable中，在JTable中实现自定义单元格渲染和编辑功能可以增强用户体验。但是，至关重要的是要确保即使在编辑操作后也保留所需的格式。在设置用于格式化“价格”列的“价格”列，用户遇到的数字格式丢失的“价格”列的“价格”之后，问题在设置自定义单元格...

编程发布于2025-07-10
您可以使用CSS在Chrome和Firefox中染色控制台输出吗？
在javascript console 中显示颜色是可以使用chrome的控制台显示彩色文本，例如红色的redors，for for for for错误消息？回答是的，可以使用CSS将颜色添加到Chrome和Firefox中的控制台显示的消息（版本31或更高版本）中。要实现这一目标，请使用以下模...

编程发布于2025-07-10