」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > “警戒時間複雜度陷阱”

“警戒時間複雜度陷阱”

發佈於2024-08-16
瀏覽:771

“Be wary of time complexity pitfalls\

警惕时间复杂度陷阱

写在这里

bilibili视频也显示了这个:[Bilibili视频][https://www.bilibili.com/video/BV16u4m1c7cU/?spm_id_from=333.999.0.0]我认为这是一个很好的视频,但它的语言是中文。

时间复杂度

  • 时间复杂度是什么意思?
  • 时间复杂度是算法运行所需时间的度量,作为其输入大小的函数。它是描述算法效率的一种方式,用于比较不同的算法并确定哪种算法最有效。

  • 如何计算时间复杂度?

  • 为了计算时间复杂度,我们需要考虑算法执行的操作数作为输入大小的函数。测量操作次数的最常见方法是计算执行特定操作的次数。

  • 计算时间复杂度时有哪些常见陷阱?

    1. 不考虑输入大小:如果我们只考虑算法执行的操作数量,我们可能会低估时间复杂度。例如,如果我们计算循环运行的次数,但不考虑输入的大小,那么时间复杂度可能会太高。
    1. 不考虑算法的效率:有些算法即使输入量很小也可能执行很多操作,这可能导致时间复杂度很高。例如,冒泡排序和选择排序等排序算法具有二次时间复杂度,即使它们可能只需要交换小数组中的两个元素。
    1. 不考虑算法的最坏情况:某些算法具有最好情况,其中执行的操作比最坏情况要少。例如,像二分搜索这样的搜索算法有一个最好的情况,即它们在对数时间内找到目标元素,但它们有一个最坏的情况,即它们需要检查数组中的所有元素。

让我们看一些时间复杂度的例子

这里有一个问题:
查找列表中最多 10 个整数。

import random
ls = [random.randint(1, 100) for _ in range(n)]

这里是测试函数:

import time
def benchmark(func, *args) -> float:
    start = time.perf_counter()
    func(*args)
    end = time.perf_counter()
    return end - start

解决方案1:使用堆

这是使用heapq模块的解决方案:

def find_max_n(ls, n):
    import heapq
    return heapq.nlargest(n, ls)

或者我们用python的方式写:

def find_largest_n(nums, n):
    if n  max_heap[0]:
            max_heap[0] = num
            _sift_down(max_heap, 0)

    return max_heap

def _sift_down(heap, index):
    left = 2 * index   1
    right = 2 * index   2
    largest = index

    if left  heap[largest]:
        largest = left

    if right  heap[largest]:
        largest = right

    if largest != index:
        heap[index], heap[largest] = heap[largest], heap[index]
        _sift_down(heap, largest)

解决方案2:使用排序

这里是使用排序功能的解决方案:

def find_max_n(ls, n):
    return sorted(ls, reverse=True)[:n]

几乎所有人都知道,堆的时间复杂度是 O(n log k),排序函数的时间复杂度是 O(n log n)。

看来第一个解决方案比第二个更好。但在Python中却并非如此。

看最终代码:

import time
def benchmark(func, *args) -> float:
    start = time.perf_counter()
    func(*args)
    end = time.perf_counter()
    return end - start

def find_max_n_heapq(ls, n):
    import heapq
    return heapq.nlargest(n, ls)

def find_max_n_python_heap(nums, n):
    if n  max_heap[0]:
            max_heap[0] = num
            _sift_down(max_heap, 0)

    return max_heap

def _sift_down(heap, index):
    left = 2 * index   1
    right = 2 * index   2
    largest = index

    if left  heap[largest]:
        largest = left

    if right  heap[largest]:
        largest = right

    if largest != index:
        heap[index], heap[largest] = heap[largest], heap[index]
        _sift_down(heap, largest)


def find_max_n_sorted(ls, n):
    return sorted(ls, reverse=True)[:n]

# test
import random
for n in range(10, 10000, 100):
    ls = [random.randint(1, 100) for _ in range(n)]
    print(f"n = {n}")
    print(f"Use    Heapq: {benchmark(find_max_n_heapq, ls, n)}")
    print(f"Python Heapq: {benchmark(find_max_n_python_heap, ls, n)}")
    print(f"Sorted      : {benchmark(find_max_n_sorted, ls, n)}")

我在Python3.11 VScode中运行,结果如下:

n 不大

使用堆:0.002430099993944168
Python堆:0.06343129999004304
排序:9.280000813305378e-05
n = 910
使用堆:9.220000356435776e-05
Python堆:0.07715500006452203
排序:9.360001422464848e-05
n = 920
使用堆:9.440002031624317e-05
Python堆:0.06573969998862594
排序:0.00012450001668184996
n = 930
使用堆:9.689992293715477e-05
Python堆:0.06760239996947348
已排序:9.66999214142561e-05
n = 940
使用堆:9.600003249943256e-05
Python堆:0.07372559991199523
排序:9.680003859102726e-05
n = 950
使用堆:9.770004544407129e-05
Python堆:0.07306570000946522
排序:0.00011979998089373112
n = 960
使用堆:9.980006143450737e-05
Python堆:0.0771204000338912
排序:0.00022829999215900898
n = 970
使用堆:0.0001601999392732978
Python堆:0.07493270002305508
排序:0.00010840001050382853
n = 980
使用堆:9.949994273483753e-05
Python 堆:0.07698320003692061
排序:0.00010300008580088615
n = 990
使用堆:9.979994501918554e-05
Python堆:0.0848745999392122
排序:0.00012620002962648869

如果n很大?

n = 10000
使用堆:0.003642000025138259
Python 堆:9.698883199947886
排序:0.00107999995816499
n = 11000
使用堆:0.0014836000045761466
Python 堆:10.537632800056599
排序:0.0012236000038683414
n = 12000
使用堆:0.001384599949233234
Python 堆:12.328411899972707
排序:0.0013226999435573816
n = 13000
使用堆:0.0020017001079395413
Python 堆:15.637207800056785
排序:0.0015075999544933438
n = 14000
使用堆:0.0017026999266818166
Python 堆:17.298848500009626
排序:0.0016967999981716275
n = 15000
使用堆:0.0017773000290617347
Python 堆:20.780625900020823
排序:0.0017105999868363142

我发现了什么以及如何改进它

当n很大时,Sorted会花费一点时间(有时甚至比使用heapq更好),但Python Heapq会花费很多时间。

  • 为什么Sorted花费一点时间,而Python Heapq花费很多时间?
  • 因为sorted()是Python中的内置函数,所以你可以找到关于它的Python官方文档。

内置函数比 heapq 更快,因为它是用 C 编写的,C 是一种编译语言。

  • 如何改进?
  • 您可以使用内置函数sorted()代替heapq.sort()来提高代码的性能。 Sorted() 函数是 Python 中的内置函数,它是用 C 实现的,因此比 heapq.sort()
  • 快得多

脑震荡

当我们处理大数据时,我们应该使用内置函数而不是 heapq.sort() 来提高代码的性能。在处理大数据时,我们必须警惕时间复杂度陷阱。有时时间复杂度的陷阱是不可避免的,但我们应该尽量避免它们。

关于我

大家好,我是梦沁园。我是一名学生。我喜欢学习新事物。
你可以看我的github:[MengQinYuan的Github][https://github.com/mengqinyuan]

版本聲明 本文轉載於:https://dev.to/mengqinyuan/be-wary-of-time-complexity-pitfalls-13jf?1如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • 如何在 Golang Web 伺服器中串流 MP4 影片?
    如何在 Golang Web 伺服器中串流 MP4 影片?
    GoLang Web 伺服器串流影片GoLang Web 伺服器串流影片GoLang Web 伺服器串流影片問:Golang Web 伺服器設定為服務HTML、CSS、JavaScript 和映像失敗嘗試串流式傳輸MP4 視訊。 if contentType == "video/mp4&q...
    程式設計 發佈於2024-11-14
  • Bootstrap 4 Beta 中的列偏移發生了什麼事?
    Bootstrap 4 Beta 中的列偏移發生了什麼事?
    Bootstrap 4 Beta:列偏移的刪除和恢復Bootstrap 4 在其Beta 1 版本中引入了重大更改柱子偏移了。然而,隨著 Beta 2 的後續發布,這些變化已經逆轉。 從 offset-md-* 到 ml-auto在 Bootstrap 4 Beta 1 中, offset-md-*...
    程式設計 發佈於2024-11-14
  • CSS 中的「display: table-column」實際上做了什麼?
    CSS 中的「display: table-column」實際上做了什麼?
    CSS「display: table-column」該如何運作? 在 HTML 中,表格由行組成,每行含有細胞。 CSS 擴展了這個概念,讓設計者定義特定的行和列佈局。雖然「display: table-row」和「display: table-cell」很簡單,但「display: table-c...
    程式設計 發佈於2024-11-14
  • Babel 6 如何以不同的方式處理預設導出?
    Babel 6 如何以不同的方式處理預設導出?
    重大變更:Babel 6 匯出預設行為隨著 Babel 6 的發布,預設導出的處理方式發生了重大變化。雖然 Babel 之前新增了 module.exports = Exports["default"] 行,但此功能已被刪除。 此修改需要更改模組導入語法。以前,使用舊語法的程式碼...
    程式設計 發佈於2024-11-14
  • 掌握 Next.js 中的 SSR:如何提升 SEO 與使用者體驗
    掌握 Next.js 中的 SSR:如何提升 SEO 與使用者體驗
    SSR(伺服器端渲染)是 Next.js 中產生頁面的另一種方法。在本文中,我想解釋什麼是 SSR、它是如何運作的,以及如何在 Next.js 專案的 Page Router 和 App Router 中實現它。 什麼是SSR? SSR是一種在使用者發出請求後產生靜態頁面(或預先渲...
    程式設計 發佈於2024-11-14
  • 為什麼 PHP 5.2 不允許抽象靜態類別方法?
    為什麼 PHP 5.2 不允許抽象靜態類別方法?
    PHP 5.2 嚴格模式:為什麼不允許抽象靜態類別方法? 在 PHP 5.2 中,啟用嚴格警告可能會觸發熟悉的警告:「靜態函數不應該是抽象的」。此警告源自於 PHP 5.2 中引入的一項更改,該更改不允許抽象靜態類別方法。 原因:歷史監督PHP 5.2 最初缺乏後期靜態綁定,使抽象靜態函數變得無用。...
    程式設計 發佈於2024-11-14
  • 如何為 10 個連續點的每段繪製不同顏色的線?
    如何為 10 個連續點的每段繪製不同顏色的線?
    用不同的顏色繪製一條線問題陳述給定兩個列表,latt和lont,目標是繪製一條線,其中每個清單10個連續點的線段以不同的顏色表示。 解決方案解決方案線段數量有限import numpy as np import matplotlib.pyplot as plt # Generate random c...
    程式設計 發佈於2024-11-14
  • 如何在 MySQL 中根據計數過濾資料而不使用嵌套 SELECT?
    如何在 MySQL 中根據計數過濾資料而不使用嵌套 SELECT?
    MySQL - 在WHERE 子句中使用COUNT(*)使用者在嘗試使用WHERE 子句中的COUNT(*) 函數過濾MySQL 中的資料時遇到了挑戰WHERE 子句。他們尋求一種有效的方法來完成此任務,而不使用巢狀 SELECT 語句,因為它會消耗大量資源。 使用者提供了以下偽代碼來說明他們期望的...
    程式設計 發佈於2024-11-14
  • 如何在 Python 中按名稱存取 SQL 結果列值?
    如何在 Python 中按名稱存取 SQL 結果列值?
    在Python 中按列名稱存取SQL 結果列值處理資料庫中的大量列時,依賴列索引資料來擷取可能會變得很麻煩。本文透過提供一種在 Python 中使用列名稱檢索 SQL 結果列值的方法來解決對更直觀方法的需求。 解決方案:利用 DictCursor Python 的 MySQLdb 模組提供了 Dic...
    程式設計 發佈於2024-11-14
  • 何時使用 Django ORM 的 select_lated 與 prefetch_lated?
    何時使用 Django ORM 的 select_lated 與 prefetch_lated?
    Django ORM 的 select_lated 和 prefetch_lated 之間的區別在 Django ORM 中,select_lated 和 prefetch_lated 方法在管理資料庫查詢中的關係方面具有不同的用途。 select_latedDjango的select_lated方...
    程式設計 發佈於2024-11-14
  • 大批
    大批
    方法是可以在物件上呼叫的 fns 數組是對象,因此它們在 JS 中也有方法。 slice(begin):將陣列的一部分提取到新數組中,而不改變原始數組。 let arr = ['a','b','c','d','e']; // Usecase: Extract till index ...
    程式設計 發佈於2024-11-14
  • 在 Go 中使用 WebSocket 進行即時通信
    在 Go 中使用 WebSocket 進行即時通信
    构建需要实时更新的应用程序(例如聊天应用程序、实时通知或协作工具)需要一种比传统 HTTP 更快、更具交互性的通信方法。这就是 WebSockets 发挥作用的地方!今天,我们将探讨如何在 Go 中使用 WebSocket,以便您可以向应用程序添加实时功能。 在这篇文章中,我们将介绍: WebSoc...
    程式設計 發佈於2024-11-13
  • 如何在 PHP 中組合兩個關聯數組,同時保留唯一 ID 並處理重複名稱?
    如何在 PHP 中組合兩個關聯數組,同時保留唯一 ID 並處理重複名稱?
    在 PHP 中組合關聯數組在 PHP 中,將兩個關聯數組組合成一個數組是常見任務。考慮以下請求:問題描述:提供的代碼定義了兩個關聯數組,$array1和$array2。目標是建立一個新陣列 $array3,它合併兩個陣列中的所有鍵值對。 此外,提供的陣列具有唯一的 ID,而名稱可能重疊。要求是建構一...
    程式設計 發佈於2024-11-13
  • 使用 Python 將 .png 檔案從一個資料夾移到另一個資料夾
    使用 Python 將 .png 檔案從一個資料夾移到另一個資料夾
    嘗試之前;請確保您的電腦上安裝了 python。 在 python IDE 中,您需要先匯入 pathlib 和 os 函式庫。兩者都是 python 標準函式庫的一部分,因此不需要外部安裝。 1.)導入必要的函式庫(pathlib和os)。 2.)找到桌面的路徑。 3.) 建立一個名為「S...
    程式設計 發佈於2024-11-13
  • Node.js 流:什麼、為什麼以及如何使用它們
    Node.js 流:什麼、為什麼以及如何使用它們
    高效处理大数据对于现代 Web 应用程序至关重要。将整个文件加载到内存中的传统方法对于处理大量数据来说并不是最佳选择。这就是 Node.js 中的 Streams 派上用场的地方。它们允许您逐段(以块的形式)处理数据,从而提高性能、减少内存使用并提高效率。在本文中,我们将探讨什么是流、为什么它们很重...
    程式設計 發佈於2024-11-13

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3