」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > 有多少 Python 套件的版本控制正確?

有多少 Python 套件的版本控制正確?

發佈於2024-11-08
瀏覽:437

前幾天,當我研究Python套件中的漏洞資料庫時,我意識到其中的一些套件版本無法輕鬆解析並與其他版本字串進行比較,因為它們不遵守Python 版本控制- 舊的PEP 440或取代它的版本說明符規範。所以我開始想知道這種情況有多普遍。 Python 套件索引上有多少套件實際上有有效版本?

顯而易見的答案是:去檢查。因此,我創建了一個新的虛擬環境,下載了請求,然後繼續編寫一個多處理腳本來查詢 PyPI API,以獲取每個套件使用的每個版本字串。即使在所有核心上運行,我也花了幾個小時,但最終我從 545,018 個包中檢索了超過 6,057,703 個版本字串,這些字串存儲在一個整潔的 SQLite 資料庫中。你可以在 Kaggle 上找到它。

接下來是解析。我發現兩個庫承諾驗證版本字串的合規性:

    pepver:「PEP-440版本解析、解釋與操作」
  • parver:「parver 允許解析和操作 PEP 440 版本號」
請注意,公平地說,這兩個仍然堅持 PEP-440,現在已被替換,所以我會記住這一點,特別是在查看標記為不合規的字符串時。

又經過幾個小時的密集多重處理,我用兩個布林列更新了我的資料庫,指示這兩個套件是否成功解析了字串(也在 Kaggle 上)。

結果

How many Python packages are versioned correctly?

快速總結我的發現:

  • 在 6,057,703 個版本字串中,發現有 5,542 個 (0.09%) 有缺陷;

  • 在 545,018 個軟體包中,1,285 個軟體包 (0.24%) 至少有一個有缺陷的版本字串。

所以總的來說,儲存庫的狀態看起來相當健康!兩個庫發現錯誤的版本字串有各種各樣。有些只是以非標準方式使用後綴,但總體上遵循語義版本控制範例,而其他則只是提交雜湊或單字和數字字串。

兩個庫意見不一致的情況更有趣。這些是 pepver 不驗證但 parver 驗證的:

0.0.2.R 0.0.2.R3 0.0.2.R4 0.0.2.R5 0.0.2.R6 0.0.2.R7

0.0.2.R
0.0.2.R3
0.0.2.R4
0.0.2.R5
0.0.2.R6
0.0.2.R7


在這種情況下,我想說 pepver 是錯的。根據 PEP440 和當前版本控制規則,r 是發布後標籤(標準化為 post)的可接受拼寫,並且字母不區分大小寫。因此,0.0.2.R3 實際上標準化為 0.0.2.post3 並且完全合法。

同時,以下是 pepver 承認但 parver 不承認的版本的隨機樣本:

0.0.1dev-20141025 1.5.0-dev-618 0.3.4.dev.20180830 1.15.0-dev-1552 1.4.0-dev-510 0.0.9.dev-20121012 0.2dev-20101203 0.3.4.dev.20180905 1.15.0-dev-1606 0.2.1dev-20110627 1.12.0-dev-1379 1.1.1-dev-275 1.3.1-dev-427

0.0.2.R
0.0.2.R3
0.0.2.R4
0.0.2.R5
0.0.2.R6
0.0.2.R7


它們的共同點是在 dev 後綴後使用其他數字(有時是日期),並帶有一些分隔符號。這確實也是錯誤的,因為在這種情況下規範不允許使用分隔符號。所以帕弗似乎又是對的。

無論如何,這幾乎滿足了我最初的好奇心,並使我放心,在絕大多數情況下,解析和比較版本的標準方法就足夠了。即使在非標準版本中,識別訂單通常也相當容易,因為偏差很小。儘管如此,了解官方版本控制的所有怪癖並了解我們何時可以或不能依賴它們還是很有用的。

版本聲明 本文轉載於:https://dev.to/stur86/how-many-python-packages-are-versioned-correctly-5l8?1如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • 如何計算 Python 中 ndarray 的出現次數?
    如何計算 Python 中 ndarray 的出現次數?
    計數ndarray 中的出現次數在numpy 中,嘗試執行以下操作時可能會遇到錯誤「numpy.ndarray 物件沒有屬性計數」使用.count() 方法來計算陣列中特定值的出現次數。 使用numpy.unique解決這個問題的方法是使用 numpy.unique()。此函數識別數組中的唯一值並提...
    程式設計 發佈於2024-11-08
  • 似乎沒有人談論的一件事
    似乎沒有人談論的一件事
    我認為我們大多數軟體開發人員發生的第一件事導致我們失去希望,那就是我們被迫走捷徑。 我們基本上被告知你必須在一定的期限內完成。 我們開始做一些工作,當我們接近最後期限時,我們不可避免地意識到這將花費我們比我們想像的更長的時間。 如果您一直在編程或進行軟體開發。 無論您是從事維運、使用者體驗或...
    程式設計 發佈於2024-11-08
  • 如何在 PHP 中從數組產生查詢字串?
    如何在 PHP 中從數組產生查詢字串?
    在PHP 中從陣列建立查詢字串PHP 框架提供了專門為從陣列建立查詢字串而設計的多功能函數:http_build_query()。此函數的主要目的是將鍵值對陣列轉換為標準 URL 編碼的查詢字串。 使用http_build_query()http_build_query( 的語法)如下:string...
    程式設計 發佈於2024-11-08
  • JavaScript 中基本物件和函數連結的原則是什麼?
    JavaScript 中基本物件和函數連結的原則是什麼?
    了解 JavaScript 中的基本物件/函數鏈函數鍊是一種程式設計技術,可讓開發人員建立按特定順序執行的操作序列。在 JavaScript 中,這是透過傳回函數本身和使用 this 關鍵字結合來實現的。 要了解連結的原理,讓我們來看一個工作範例:var one = function(num) { ...
    程式設計 發佈於2024-11-08
  • 開發工具不是必需的
    開發工具不是必需的
    幾個月前我正在開發一個前端專案。該專案是一個微前端,旨在整合到遺留儀表板上。 採用微前端方法的原因是為了降低儀表板上的複雜度。我對這個挑戰感到興奮並投入其中。 我使用 webpack、react 和 typescript 設定微前端。我使用 chakra ui 作為 CSS-IN-JS 框架,使...
    程式設計 發佈於2024-11-08
  • OpenAI 在簡化程式碼方面出奇地好
    OpenAI 在簡化程式碼方面出奇地好
    While browsing the Internet for inspiration, I came across an interesting-looking component. I thought the block with the running ASCII art looked coo...
    程式設計 發佈於2024-11-08
  • 有毒的 Laravel 社區如何摧毀了我對程式設計的熱情。
    有毒的 Laravel 社區如何摧毀了我對程式設計的熱情。
    我仍然记得那件事就像昨天一样,但当我踏上成为一名 Web 开发人员的旅程时,已经是二十多年前了。 我拨打了我的 56k 调制解调器,占用了电话线,这样我就可以浏览一些我最喜欢的网站。然后我想知道如何自己制作。 我发现我可以在 Microsoft Word 中处理 HTML。我创建了一个包含滚动字幕、...
    程式設計 發佈於2024-11-08
  • 與工人一起部署
    與工人一起部署
    按鈕產生器 按鈕產生器是一款旨在簡化 GitHub 上託管專案的部署流程的工具。透過建立「部署到 Cloudflare Workers」按鈕,您可以簡化部署流程,讓使用者只需按一下即可將您的應用程式部署到 Cloudflare Workers。 此按鈕為使用者提供了一種將專案直接...
    程式設計 發佈於2024-11-08
  • 使用 PHP 操作字串
    使用 PHP 操作字串
    字串是程式設計中用來表示字元序列的資料型別。這些字元可以是字母、數字、空格、符號等。在許多程式語言中,字串用單引號 (') 或雙引號 (") 括起來。 字串連線 連接是將兩個或多個字串連接在一起的過程。 <?php $name = "John"; $lastname = "...
    程式設計 發佈於2024-11-08
  • jQuery 可以幫助使用 Comet 模式進行伺服器傳送訊息嗎?
    jQuery 可以幫助使用 Comet 模式進行伺服器傳送訊息嗎?
    利用Comet 透過jQuery 進行伺服器傳送訊息在JavaScript 程式設計領域,伺服器推播功能已經獲得了突出地位,彗星設計模式正在成為一種流行的方法。本文探討了建構在著名 jQuery 函式庫之上的此類解決方案的可用性。 基於 jQuery 的 Comet 實現儘管 Comet 模式很流行...
    程式設計 發佈於2024-11-08
  • 如何在 Keras 中實作 Dice 誤差係數的自訂損失函數?
    如何在 Keras 中實作 Dice 誤差係數的自訂損失函數?
    Keras 中的自訂損失函數:實作Dice 誤差係數在本文中,我們將探討如何建立自訂損失函數在Keras 中,聚焦在Dice 誤差係數。我們將學習實現參數化係數並將其包裝以與 Keras 的要求相容。 實現係數我們的自訂損失函數將需要係數和一個包裝函數。此係數測量 Dice 誤差,該誤差比較目標值和...
    程式設計 發佈於2024-11-08
  • 為什麼 MySQL 會拋出「警告:mysql_fetch_assoc 參數無效」錯誤?
    為什麼 MySQL 會拋出「警告:mysql_fetch_assoc 參數無效」錯誤?
    MySQL 警告:mysql_fetch_assoc 的參數無效問題:嘗試從MySQL 檢索資料時資料庫時,遇到以下錯誤訊息:mysql_fetch_assoc(): supplied argument is not a valid MySQL result resource說明:mysql_fet...
    程式設計 發佈於2024-11-08
  • 在 Python 中使用 ElementTree 的「find」和「findall」方法時如何忽略 XML 命名空間?
    在 Python 中使用 ElementTree 的「find」和「findall」方法時如何忽略 XML 命名空間?
    在ElementTree 的“find”和“findall”方法中忽略XML 命名空間使用ElementTree 模組解析和定位XML 文件中的元素時,命名空間會帶來複雜性。以下介紹如何在 Python 中使用「find」和「findall」方法時忽略命名空間。 當 XML 文件包含命名空間時,會導...
    程式設計 發佈於2024-11-08
  • 為什麼在 Node.js 應用程式中連接到 MySQL 時出現「connect ECONNREFUSED」錯誤?
    為什麼在 Node.js 應用程式中連接到 MySQL 時出現「connect ECONNREFUSED」錯誤?
    Node.js MySQL:解決「connect ECONNREFUSED」錯誤將Node.js 應用程式部署到遠端伺服器時,您可以嘗試建立與MySQL 資料庫的連線時遇到「connect ECONNREFUSED」錯誤。當 MySQL 連線參數中提供的主機配置不正確時,通常會出現此問題。 在您的特...
    程式設計 發佈於2024-11-08
  • 用 Go 建構密碼管理器
    用 Go 建構密碼管理器
    作为一名软件开发人员,我一直对安全性和可用性的交集着迷。最近,我决定开始一个令人兴奋的项目:使用 Go 创建一个命令行密码管理器。我想与您分享这段旅程的开始,从第一次提交开始。 创世记 2023 年 11 月 27 日,我对我的项目进行了初步提交,我将其命名为“dost”(印地语中的...
    程式設計 發佈於2024-11-08

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3