」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > 為什麼 np.vectorize() 比 df.apply() 對於 Pandas 列創建更快?

為什麼 np.vectorize() 比 df.apply() 對於 Pandas 列創建更快?

發佈於2024-11-08
瀏覽:753

  Why is np.vectorize() Faster than df.apply() for Pandas Column Creation?

Pandas apply 與 np.vectorize 的表現比較

據觀察,np.vectorize() 可以明顯快於 df。基於 Pandas DataFrame 中的現有欄位建立新欄位時使用 apply() 。觀察到的性能差異源自於這兩種方法所採用的底層機制。

df.apply() 與 Python 層級循環

df.apply() 本質上建立迭代 DataFrame 的每一行的 Python 層級循環。正如提供的基準測試中所演示的,與真正的向量化計算相比,Python 級循環(例如列表推導式和映射)都相對較慢。

np.vectorize() vs df.apply()

np.vectorize() 將使用者定義函數轉換為通用函數 (ufunc)。 Ufunc 經過高度最佳化,可以利用基於 C 的程式碼和最佳化演算法對 NumPy 陣列執行逐元素操作。這與 df.apply() 形成對比,df.apply() 對 Pandas Series 物件進行操作並產生額外的開銷。

真正的向量化:最佳效能

真正有效率的列創建,強烈建議在 NumPy 中進行向量化計算。 numpy.where 等操作以及使用 df["A"] / df["B"] 進行直接逐元素除法的速度非常快,並且避免了與循環相關的開銷。

Numba 最佳化

為了提高效率,可以使用 Numba 進一步最佳化循環,Numba 是將 Python 函數轉換為最佳化的 C 程式碼的編譯器。 Numba 可以將執行時間減少到微秒,顯著優於 df.apply() 和 np.vectorize()。

結論

雖然np.vectorize() 可能提供對df.apply() 進行了一些改進,它並不是NumPy 中矢量化計算的真正替代品。為了實現最大效能,請利用 Numba 最佳化或 NumPy 中的直接向量化操作在 Pandas DataFrames 中建立新欄位。

最新教學 更多>
  • 如何找到一個資料幀中存在但另一個資料幀中不存在的行(比較 df1 和 df2)?
    如何找到一個資料幀中存在但另一個資料幀中不存在的行(比較 df1 和 df2)?
    比較資料幀:尋找中存在但另一個中不存在的行比較資料幀以識別差異對於資料品質保證和合併至關重要營運。在本例中,我們有兩個具有特定結構的資料幀(df1 和 df2),需要確定 df2 中存在但 df1 中不存在的行。 最初,嘗試使用 df1 != df2 比較資料幀,結果是錯誤。此方法僅適用於具有相同行...
    程式設計 發佈於2024-11-08
  • CSS 中的動畫
    CSS 中的動畫
    CSS中的動畫有兩個部分 - @keyframes和animation-*。 @keyframes at 規則 第一部分要求我們定義@keyframes。 這讓我們可以指定在動畫持續時間的不同點應套用的 CSS 樣式。 不同的時間點以百分比值指定。可以指定 0 到 100% 之...
    程式設計 發佈於2024-11-08
  • 使用 React 建立汽車租賃平台
    使用 React 建立汽車租賃平台
    BookCars 是一個面向供應商的汽車租賃平台,具有用於管理車隊和預訂的後端,以及用於租車的前端和行動應用程式。 透過以下解決方案,您可以透過將其託管在具有至少1GB RAM 的Docker Droplet 上,以非常低的成本建立一個針對多個供應商進行優化的完全可自訂的汽車租賃網站,並使用可操作...
    程式設計 發佈於2024-11-08
  • 模擬資料產生器:高效率軟體測試的關鍵
    模擬資料產生器:高效率軟體測試的關鍵
    模拟数据生成在软件测试和开发中发挥着至关重要的作用,使团队能够在不依赖实时数据的情况下模拟真实场景。无论您是测试新功能还是开发 API,模拟数据都有助于简化流程,确保测试一致、可靠,而无需访问生产数据库。 在本文中,我们将深入探讨模拟数据生成器是什么、为什么它们很重要、如何实现它们以及当今开发人员...
    程式設計 發佈於2024-11-08
  • 模擬請求
    模擬請求
    冷靜一點,提交者王,我不會談論 JSON-Server,但它值得留下來! 每個前端都會經歷模擬端點請求的需要,有時是因為後端還沒有完成其工作,有時是為了調試和模擬特定情況,這在日常生活中很常見。 是的,JSON-Server 令人難以置信並且使用起來非常簡單,但是幾天前我遇到了一個非常具體的問題...
    程式設計 發佈於2024-11-08
  • 如何在 PHP 中迭代遍歷和處理子目錄內的檔案?
    如何在 PHP 中迭代遍歷和處理子目錄內的檔案?
    如何在PHP中遍歷子目錄並迭代處理文件在PHP中,遍歷子目錄並迭代處理文件可以使用RecursiveDirectoryIterator和RecursiveIteratorIterator來實作。讓我們了解如何根據需要建立程式碼:// Initializing the path to the main...
    程式設計 發佈於2024-11-08
  • 癮君子 # 何時使用效果、Angular DI 功能、請求快取等
    癮君子 # 何時使用效果、Angular DI 功能、請求快取等
    ?嘿,Angular Addict 夥伴 這是 Angular Addicts Newsletter 的第 30 期,這是一本每月精選的引起我注意的 Angular 資源合集。 (這裡是第29期、28期、27期) ?發佈公告 ?Nx 19.8 更新 ...
    程式設計 發佈於2024-11-08
  • 如何吸引頂尖 Python 開發人員到你的公司
    如何吸引頂尖 Python 開發人員到你的公司
    在竞争激烈的技术领域,吸引顶级 Python 开发人员对于任何希望利用这种多功能编程语言的力量的组织来说至关重要。随着 Python 继续在 Web 开发、数据科学和机器学习等领域占据主导地位,对熟练 Python 开发人员的需求空前高涨。如果您想聘请能够推动创新并为您的项目做出有意义贡献的 Pyt...
    程式設計 發佈於2024-11-08
  • **JavaScript 中 `location = URL` 和 `location.href = URL` 有什麼不同?
    **JavaScript 中 `location = URL` 和 `location.href = URL` 有什麼不同?
    JavaScript:「location = URL」和「location.href = URL」的差異在JavaScript 中,操作網頁的URL 可以透過以下方式實現兩種類似的方法:直接設定location 屬性或設定location.href 屬性。雖然功能可能看起來相同,但這兩種方法之間存在...
    程式設計 發佈於2024-11-08
  • 如何有效地將PHP變數插入字串?
    如何有效地將PHP變數插入字串?
    將PHP 變數插入字串將PHP 變數合併到字串中時,注意語法以確保所需的輸出為至關重要的獲得。為了解決這個問題,讓我們檢查一下提示中顯示的程式碼:目標是包含$ width 變數在寬度樣式屬性中,並確保其後跟“px”。不幸的是,嘗試用空格分隔變數和“px”或將它們連接在一起會導致錯誤。 解決方案1:串...
    程式設計 發佈於2024-11-08
  • 了解 JavaScript 中底線 (`_`) 的使用
    了解 JavaScript 中底線 (`_`) 的使用
    在 JavaScript 中編碼時,您可能會遇到用作變數名稱的下劃線字元 (_),特別是在函數參數中。雖然乍看之下似乎很不尋常,但由於各種原因,這種做法在開發人員中很常見。在這篇文章中,我們將探討底線代表什麼,為什麼要使用它,以及它在現實範例中的顯示方式,例如 coalesceES6 函數。 ...
    程式設計 發佈於2024-11-08
  • 像程式設計師一樣思考:學習 C 基礎知識
    像程式設計師一樣思考:學習 C 基礎知識
    以程式設計師思考學習 C 語言:基本語法:變數、資料型態、常數、運算子、控制流。實戰案例:計算兩個數的平均值,輸入兩個整數並計算其平均值。 以程式設計師思考:用C 語言學習基礎引言學習程式設計並不難,尤其是當你以程式設計師思維思考時。本文將從基礎開始,用 C 語言引導你逐步了解程式設計入門知識。 C...
    程式設計 發佈於2024-11-08
  • Python 中的列表理解語法何時需要三元運算子?
    Python 中的列表理解語法何時需要三元運算子?
    列表理解難題:可迭代物件中的條件篩選在Python 中,列表理解提供了一種基於現有可迭代物件建立清單的簡潔方法。然而,出現了一個關於涉及 if 語句的列表理解的問題。 目標是比較兩個可迭代物件 a 和 b,並僅列印兩者中出現的元素。預期的程式碼如下所示:print([y if y not in b ...
    程式設計 發佈於2024-11-08
  • 使用 MetaTrader 訂單管理和市場資料收集進行自動交易
    使用 MetaTrader 訂單管理和市場資料收集進行自動交易
    Your AsimovMT class provides a comprehensive interface for interacting with MetaTrader5 (MT5) using Python. However, there are several areas in your c...
    程式設計 發佈於2024-11-08
  • Python 清單的最大大小是多少以及它如何影響功能?
    Python 清單的最大大小是多少以及它如何影響功能?
    Python列表的最大大小:綜合分析在Python中,列表是基本的資料結構,可以容納多個不同類型的元素。它們的多功能性和靈活性使得了解它們的局限性至關重要,特別是在處理大型數據集時。本文探討了 Python 清單可以達到的最大大小及其對其功能的影響。 最大清單大小Python 清單的最大大小已定義通...
    程式設計 發佈於2024-11-08

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3