」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > 如何從具有不同數組長度的字典創建 Pandas DataFrame?

如何從具有不同數組長度的字典創建 Pandas DataFrame?

發佈於2024-11-09
瀏覽:729

How to Create a Pandas DataFrame from a Dictionary with Varying Array Lengths?

從條目長度不均勻的字典建立 DataFrame

在 Python 中,可以從每個條目保存一個 Numpy 陣列的字典建立 DataFrame。然而,當條目之間的數組長度不同時,就會出現挑戰。預設情況下,Pandas 需要統一長度的數組,從而導致類似“ValueError: arrays must all be the same length.”的錯誤。

克服長度差異

要解決對於這個問題,我們可以利用 Pandas 的功能,使用 NaN(非數字)值作為缺失資料的佔位符。透過利用這一點,我們可以有效地建立一個包含不同長度列的 DataFrame。

為了實現這一點,我們可以將每個字典條目轉換為 Pandas Series,這是一個可以無縫處理缺失值的一維數組。透過將字典項包裝在生成器表達式中並使用 Series 建構函數,我們可以建立 Series 物件的字典。

import pandas as pd
import numpy as np

# Sample data with uneven array lengths
data = {
    'A': np.random.randn(5),
    'B': np.random.randn(8),
    'C': np.random.randn(4)
}

# Convert dictionary items to Series
series_dict = dict((k, pd.Series(v)) for k, v in data.items())

# Create DataFrame from the dictionary of Series
df = pd.DataFrame(series_dict)

結果:

In [1]: df
Out[1]:
        A         B         C
0  1.162543  1.681243  0.191287
1  0.459621  -0.141198 -0.109864
2  -0.866704 -0.128677  -0.511496
3  1.222436  -0.371449 -0.705894
4  -0.980584  1.255133       NaN
5        NaN -0.351051       NaN
6        NaN  0.443017       NaN
7        NaN -1.053693       NaN

很明顯,DataFrame 包含數組長度不同的缺失值 (NaN),允許我們從具有不同數組長度的字典創建具有不同列長度的 DataFrame。

最新教學 更多>
  • 大批
    大批
    方法是可以在物件上呼叫的 fns 數組是對象,因此它們在 JS 中也有方法。 slice(begin):將陣列的一部分提取到新數組中,而不改變原始數組。 let arr = ['a','b','c','d','e']; // Usecase: Extract till index ...
    程式設計 發佈於2024-11-13
  • Bootstrap 4 Beta 中的列偏移發生了什麼事?
    Bootstrap 4 Beta 中的列偏移發生了什麼事?
    Bootstrap 4 Beta:列偏移的刪除和恢復Bootstrap 4 在其Beta 1 版本中引入了重大更改柱子偏移了。然而,隨著 Beta 2 的後續發布,這些變化已經逆轉。 從 offset-md-* 到 ml-auto在 Bootstrap 4 Beta 1 中, offset-md-*...
    程式設計 發佈於2024-11-13
  • 如何在 PHP 中組合兩個關聯數組,同時保留唯一 ID 並處理重複名稱?
    如何在 PHP 中組合兩個關聯數組,同時保留唯一 ID 並處理重複名稱?
    在 PHP 中組合關聯數組在 PHP 中,將兩個關聯數組組合成一個數組是常見任務。考慮以下請求:問題描述:提供的代碼定義了兩個關聯數組,$array1 和 $array2。目標是建立一個新陣列 $array3,它合併兩個陣列中的所有鍵值對。 此外,提供的陣列具有唯一的 ID,而名稱可能重疊。要求是建...
    程式設計 發佈於2024-11-13
  • 在 Go 中使用 WebSocket 進行即時通信
    在 Go 中使用 WebSocket 進行即時通信
    构建需要实时更新的应用程序(例如聊天应用程序、实时通知或协作工具)需要一种比传统 HTTP 更快、更具交互性的通信方法。这就是 WebSockets 发挥作用的地方!今天,我们将探讨如何在 Go 中使用 WebSocket,以便您可以向应用程序添加实时功能。 在这篇文章中,我们将介绍: WebSoc...
    程式設計 發佈於2024-11-13
  • 使用 html css 和 javascript 的圖片滑桿 carosual https://www.instagram.com/webstreet_code/
    使用 html css 和 javascript 的圖片滑桿 carosual https://www.instagram.com/webstreet_code/
    ?帶有縮圖和懸停效果的圖像輪播? 嘿,開發社群! ? 在我的最新影片中,我建立了一個優雅的圖像輪播,其縮圖突出顯示具有平滑懸停效果的活動圖像。這種互動式設計增強了使用者參與度,並為您的 Web 專案增添了現代感。 主要特點: 響應式佈局:輪播在所有螢幕尺寸上都能完美調整。 互動式縮圖:可點擊...
    程式設計 發佈於2024-11-12
  • React 的核心:理解元件重新渲染
    React 的核心:理解元件重新渲染
    在學習程式語言時,我們經常深入研究語法並專注於快速建立某些東西,有時會忽略一個關鍵問題:這種語言實際上解決了什麼問題,以及它在幕後如何運作?將我們的注意力轉移到理解語言的核心目的和機制上,可以讓學習速度更快、適應性更強,使我們能夠輕鬆駕馭最複雜的項目。語法總是可以找到的——即使是最經驗豐富的開發人員...
    程式設計 發佈於2024-11-12
  • JavaScript 中的 Deferreds、Promise 和 Future 有什麼區別?
    JavaScript 中的 Deferreds、Promise 和 Future 有什麼區別?
    JavaScript 中 Deferreds、Promise 和 Future 的區別在 JavaScript 中,deferreds、promise 和 futures 通常用於處理非同步操作。這些概念中的每一個都有其獨特的一組特徵:Deferreds在正式文件中從未明確定義,deferreds ...
    程式設計 發佈於2024-11-12
  • 為什麼我的 Web 應用程式中的請求之間沒有維護 Gorilla 會話變數?
    為什麼我的 Web 應用程式中的請求之間沒有維護 Gorilla 會話變數?
    使用 Gorilla 會話時未維護會話變數問題使用 Gorilla Sessions Web 工具包時,會話變數不會跨請求保留。當伺服器啟動並且使用者存取 localhost:8100/ 時,他們將被導向到 login.html,因為會話值不存在。登入後,會話變數將被存儲,並且使用者將被重定向到 h...
    程式設計 發佈於2024-11-12
  • 如何在Python中像“column -t”指令一樣顯示列化資料?
    如何在Python中像“column -t”指令一樣顯示列化資料?
    在 Python 中顯示列式資料在命令列管理工具領域,通常需要以良好對齊的方式呈現資料列。雖然製表符提供了一種簡單的解決方案,但在處理不同長度的資料時它們會失敗。本文旨在透過提出受 Linux「column -t」命令行為啟發的 Python 解決方案來應對這項挑戰。 Python 提供了一個強大的...
    程式設計 發佈於2024-11-12
  • 在 NumPy 數組中尋找特定行的有效方法:問題和解決方案
    在 NumPy 數組中尋找特定行的有效方法:問題和解決方案
    高效查找NumPy 數組中特定行的實例使用NumPy 數組時,可能會遇到需要確定是否array 包含特定行,但ndarray 的標準contains 方法引發了問題。本文針對此問題提出了高效且 Python 的解決方案。 一種方法涉及使用 .tolist() 將 NumPy 數組轉換為 Python...
    程式設計 發佈於2024-11-12
  • 如何解決在伺服器上使用 Matplotlib 的 Python 腳本的「_tkinter.TclError:無顯示名稱且無 $DISPLAY 環境變數」問題?
    如何解決在伺服器上使用 Matplotlib 的 Python 腳本的「_tkinter.TclError:無顯示名稱且無 $DISPLAY 環境變數」問題?
    _tkinter.TclError:沒有顯示名稱,也沒有$DISPLAY 環境變數_tkinter.TclError:沒有顯示名稱,也沒有$DISPLAY 環境變數問題使用Matplotlib 的Python 腳本在伺服器上失敗,並出現錯誤「產生繪圖時沒有顯示名稱和$DISPLAY 環境變數」。出現...
    程式設計 發佈於2024-11-12
  • 如何使用 Apache Commons IO 在 Java 中遞歸刪除目錄?
    如何使用 Apache Commons IO 在 Java 中遞歸刪除目錄?
    在 Java 中遞歸刪除目錄在 Java 中刪除空目錄非常簡單。然而,當處理包含子目錄和檔案的目錄時,該過程變得更加複雜。本文深入探討了使用 Apache Commons IO 函式庫遞歸刪除整個目錄的有效方法。 Apache Commons IO 簡介Apache Commons IO 提供了一套...
    程式設計 發佈於2024-11-12
  • 為什麼即使在同一包中使用 FXML,我的 JavaFX 應用程式也會拋出“Location is required.”錯誤?
    為什麼即使在同一包中使用 FXML,我的 JavaFX 應用程式也會拋出“Location is required.”錯誤?
    JavaFX「需要位置。」儘管FXML 位於同一個套件中仍出現錯誤在JavaFX 應用程式中,遇到「java .lang.NullPointerException: Location is required」錯誤通常表示無法載入FXML 檔案。即使 FXML 檔案與 Application 類別位於...
    程式設計 發佈於2024-11-12
  • `std::enable_if` 是如何運作的:揭開其實現和使用的神秘面紗?
    `std::enable_if` 是如何運作的:揭開其實現和使用的神秘面紗?
    理解std::enable_if:破解其目的和實現理解std::enable_if:破解其目的和實現雖然std::enable_if 的本質是在某些上下文中掌握的,但它的錯綜複雜的問題,特別是模板語句中的第二個參數和對std::enable_if 的賦值,仍然是個謎。深入研究其工作原理將解開這些謎團...
    程式設計 發佈於2024-11-12
  • 如何在 Go 中實作 Python 風格的生成器,同時避免記憶體洩漏?
    如何在 Go 中實作 Python 風格的生成器,同時避免記憶體洩漏?
    Go 中的Python 風格產生器了解通道緩衝區在您的程式碼中,您觀察到增加通道緩衝區大小從1 到10 透過減少上下文切換來增強效能。這個觀念是正確的。較大的緩衝區允許 fibonacci goroutine 提前填充多個點,從而減少 goroutine 之間持續通訊的需要。 通道生命週期和記憶體管...
    程式設計 發佈於2024-11-12

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3