机器学习中的 C++：逃离 Python 和 GIL

首页 > 编程 > 机器学习中的 C++：逃离 Python 和 GIL

机器学习中的 C++：逃离 Python 和 GIL

发布于2024-11-08

C in Machine Learning : Escaping Python

介绍

当 Python 的全局解释器锁 (GIL) 成为需要高并发或原始性能的机器学习应用程序的瓶颈时，C 提供了一个引人注目的替代方案。这篇博文探讨了如何利用 C 语言进行 ML，重点关注性能、并发性以及与 Python 的集成。

阅读完整的博客！

了解 GIL 瓶颈

在深入探讨 C 之前，我们先澄清一下 GIL 的影响：

并发限制：GIL 确保一次只有一个线程执行 Python 字节码，这会严重限制多线程环境中的性能。
受影响的用例：实时分析、高频交易或密集模拟中的应用程序经常受到此限制。

为什么选择 C 进行机器学习？

没有 GIL：C 没有与 GIL 等效的东西，允许真正的多线程。
性能：直接内存管理和优化功能可以带来显着的加速。
控制：对硬件资源的细粒度控制，对于嵌入式系统或与专用硬件连接时至关重要。

代码示例和实现

设置环境

在我们编码之前，请确保您拥有：

现代 C 编译器（GCC、Clang）。
CMake 用于项目管理（可选但推荐）。
像 Eigen 这样的用于线性代数运算的库。

C 中的基本线性回归

#include 
#include 
#include 

class LinearRegression {
public:
    double slope = 0.0, intercept = 0.0;

    void fit(const std::vector& X, const std::vector& y) {
        if (X.size() != y.size()) throw std::invalid_argument("Data mismatch");

        double sum_x = 0, sum_y = 0, sum_xy = 0, sum_xx = 0;
        for (size_t i = 0; i  x = {1, 2, 3, 4, 5};
    std::vector y = {2, 4, 5, 4, 5};

    lr.fit(x, y);

    std::cout 




  
  
  使用 OpenMP 进行并行训练


展示并发性：


#include 
#include 

void parallelFit(const std::vector& X, const std::vector& y, 
                 double& slope, double& intercept) {
    #pragma omp parallel
    {
        double local_sum_x = 0, local_sum_y = 0, local_sum_xy = 0, local_sum_xx = 0;

        #pragma omp for nowait
        for (int i = 0; i 




  
  
  使用特征值进行矩阵运算


对于逻辑回归等更复杂的操作：


#include 
#include 

Eigen::VectorXd sigmoid(const Eigen::VectorXd& z) {
    return 1.0 / (1.0   (-z.array()).exp());
}

Eigen::VectorXd logisticRegressionFit(const Eigen::MatrixXd& X, const Eigen::VectorXd& y, int iterations) {
    Eigen::VectorXd theta = Eigen::VectorXd::Zero(X.cols());

    for (int i = 0; i 




  
  
  与Python集成


对于 Python 集成，请考虑使用 pybind11:


#include 
#include 
#include "your_ml_class.h"

namespace py = pybind11;

PYBIND11_MODULE(ml_module, m) {
    py::class_(m, "YourMLClass")
        .def(py::init())
        .def("fit", &YourMLClass::fit)
        .def("predict", &YourMLClass::predict);
}




这允许您从 Python 调用 C 代码，如下所示：


import ml_module

model = ml_module.YourMLClass()
model.fit(X_train, y_train)
predictions = model.predict(X_test)





  
  
  挑战与解决方案


内存管理：使用智能指针或自定义内存分配器来高效、安全地管理内存。
错误处理：C 没有 Python 的异常处理来进行开箱即用的错误管理。实施强大的异常处理。
库支持：虽然 C 的 ML 库比 Python 少，但 Dlib、Shark 和 MLpack 等项目提供了强大的替代方案。

  
  
  结论


C 提供了一种绕过 Python 的 GIL 限制的途径，为性能关键的 ML 应用程序提供了可扩展性。虽然由于其较低级别的性质，它需要更仔细的编码，但速度、控制和并发性方面的好处可能是巨大的。随着 ML 应用程序不断突破界限，C 仍然是 ML 工程师工具包中的重要工具，尤其是与 Python 结合使用以方便使用时。


  
  
  进一步探索



SIMD 操作：研究如何使用 AVX、SSE 来获得更大的性能提升。

CUDA for C ：用于 ML 任务中的 GPU 加速。

高级 ML 算法：用 C 语言实现神经网络或 SVM，以实现性能关键型应用。

  
  
  感谢您与我一起深入研究！


感谢您花时间与我们一起探索 C 在机器学习中的巨大潜力。我希望这次旅程不仅能够启发您克服 Python 的 GIL 限制，还能够启发您在下一个 ML 项目中尝试使用 C。您对学习和突破技术极限的奉献精神是推动创新前进的动力。不断尝试，不断学习，最重要的是，不断与社区分享您的见解。在我们下一次深入研究之前，祝您编码愉快！

版本声明本文转载于：https://dev.to/evolvedev/c-in-machine-learning-escaping-pythons-gil-2117?1如有侵犯，请联系[email protected]删除

最新教程更多>

Java 的可选类型如何简化“Get”调用链中空值的处理？
使用可选的“Get”调用链安全导航在 Java 编程中，经常会遇到“get”调用链，如下所示：house.getFloor(0).getWall(WEST).getDoor().getDoorknob();为了避免潜在的 NullPointerExceptions，开发人员通常采用详细的 null ...

编程发布于2024-11-08
大泥球：理解反模式以及如何避免它
前端开发中最臭名昭著的架构反模式可能是大泥球。术语“大泥球”适用于没有明显结构或模块化组织的系统。代码库有机且混乱地增长，成为维护的噩梦。这是许多开发人员发现自己所处的情况，特别是当他们面临着按时完成任务并开发大量功能的压力时。这就是当前文章的内容：大泥球反模式以及前端开发中的示例，为什么它如此常...

编程发布于2024-11-08
如何正确使用带 Map 参数的“reflect.Call”函数？
解决reflect包中的.Call使用问题在reflect包中使用.Call函数时，遵守所需的参数格式至关重要。本文将指导您完成正确使用 .Call 函数并操作 in 变量以满足目标方法的过程。提供的示例代码中：params := "some map[string][]string&quo...

编程发布于2024-11-08
如何使用 HTML 和 CSS 创建翻页卡动画
在这篇文章中，我们将了解如何使用 HTML 和 CSS 以及渐变背景创建时尚的 3D 翻转卡片动画。访问我的网站了解结构我们将使用卡片的两侧（正面和背面）来创建翻转效果。此效果将在悬停时使用 CSS 过渡激活。 <div class="card"> <...

编程发布于2024-11-08
Python 中的 len() 函数有多高效？
Python 中 len() 函数的成本影响len() 函数是 Python 内置功能的组成部分，提供有关各种数据结构的长度的信息。具体来说，它通常与列表、元组、字符串和字典一起使用，以确定它们所包含的元素或字符的数量。与直观的感知相反，len() 函数的计算成本保持不变跨越所有上述数据类型。这意味...

编程发布于2024-11-08
如何在 Java 中将 Long 值转换为字节数组并返回？
在 Java 中将 Long 转换为字节数组并返回在 Java 中，将 long 基本数据类型转换为字节数组 (byte[] ），反之亦然是各种操作的常见任务，例如通过 TCP 连接发送数据。下面是实现此转换的全面解决方案：Long 到 Byte Arraypublic byte[] longToB...

编程发布于2024-11-08
如何使用 Selenium 在 Google Chrome 中模拟 Microsoft Edge Mobile？
使用 Selenium 更改 Google Chrome 中的用户代理在 Selenium 自动化脚本中，为浏览器窗口设置特定的用户代理对于模拟设备行为和确保网站渲染至关重要正如预期的那样。在这种情况下，我们的目标是将 Google Chrome 中的用户代理修改为 Microsoft Edge M...

编程发布于2024-11-08
哪种 MySQL 获取函数适合您的 PHP 应用程序：`mysql_fetch_array`、`mysql_fetch_assoc` 和 `mysql_fetch_object` 的比较
比较 mysql_fetch_array、mysql_fetch_assoc 和 mysql_fetch_object：综合分析mysql 函数系列在从 MySQL 查询中检索结果中起着至关重要的作用在 PHP 中。在这些函数中，mysql_fetch_array、mysql_fetch_assoc...

编程发布于2024-11-08
Lerna – Monorepo 管理的关键
欢迎回到莫诺雷波城堡！现在城堡已经建成，每个房间（项目）都已就位。但如果没有正确的管理，事情可能会变得混乱。谁来帮助城堡顺利运转？这时勒纳登场了——一位强大的巫师，拥有神奇的命令，可以让一切保持秩序。 Lerna 是您在 monorepo 土地上的向导，确保所有房间（项目）同步，所有包都链接，并且...

编程发布于2024-11-08
如何在 PHP 中循环嵌套数组并显示特定值？
PHP foreach 与嵌套数组：综合指南在 PHP 中，浏览嵌套数组可能是一个常见的挑战。本讨论重点讨论特定场景，您的目标是显示嵌套数组的子集，特别是第二个嵌套数组中的值。将 foreach 与嵌套数组结合使用要使用 foreach 处理嵌套数组，可以采用以下方法：示例：$tmpArray = ...

编程发布于2024-11-08
提升 Web 性能：前端开发人员指南
大家好！自从我上次写博客以来已经有一段时间了，我承认，这让我有点难过。现实是，有太多东西需要学习，有时感觉永远没有足够的时间来深入了解所有内容。我在跟谁开玩笑呢？事实是，我最近拖延得很厉害。但最近，我一直在探索网络性能——这对于任何前端开发人员来说都是一个至关重要的话题——我很高兴分享我所学到的东...

编程发布于2024-11-08
如何利用先进的加密技术增强数据保护？
对称密钥加密：FernetPython 拥有强大的加密库，提供 Fernet，这是一种安全、最佳实践的加密方案。 Fernet 采用 AES CBC 加密、HMAC 签名以及版本和时间戳信息来保护数据。建议使用 Fernet.generate_key() 生成密钥。from cryptography...

编程发布于2024-11-08
什么是本地主机？本地主机作为开发人员的用途
您有没有想过当开发人员在将网站上线之前测试网站时会发生什么？或者网络管理员如何检查他们的系统是否正常工作？答案在于一个强大但经常被误解的概念，称为 localhost。让我们深入了解 localhost 是什么、它为何重要以及它如何变得非常有用。什么是本地主机？用最简单的术语来说...

编程发布于2024-11-08
为什么 Debian 和 Ubuntu Docker 容器之间的标准输出缓冲不同？
Docker 容器中的标准输出缓冲：Debian 与 Ubuntu 的案例在 Docker 容器中执行代码时，标准输出缓冲可能会发生在在某些情况下，但在其他情况下则不然。在使用 io.MultiWriter 将 stdout 定向到控制台和日志文件的情况下会出现此问题。根本原因：平台差异根本原因造成...

编程发布于2024-11-08
语义HTML
语义 HTML 是 HTML 的一部分，可帮助您以维护和 SEO 友好的方式组织您的网站。 SEO 代表：搜索引擎优化。当您在构建网站时遵循 HTML 语义时，该网站往往会更容易被搜索引擎排名更高，当然也能让屏幕阅读器更轻松地浏览您的网站。以下是一些语义 HTML 标签： 1- “标题”标...

编程发布于2024-11-08