”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 如何在 Pandas 中将嵌套 JSON 对象作为 DataFrame 进行管理?

如何在 Pandas 中将嵌套 JSON 对象作为 DataFrame 进行管理?

发布于2024-11-08
浏览:373

How to Manage Nested JSON Objects as a DataFrame in Pandas?

使用嵌套对象读取嵌套 JSON 作为 Pandas DataFrame

处理包含嵌套对象的 JSON 数据时,在 Python 中高效地操作它至关重要。 Pandas 提供了一个强大的工具来实现此目的 - json_normalize。

将数组扩展为列

要将位置数组扩展为单独的列,请使用 json_normalize,如下所示:

import json
import pandas as pd

with open('myJson.json') as data_file:
    data = json.load(data_file)

df = pd.json_normalize(data, 'locations', ['date', 'number', 'name'], record_prefix='locations_')

print(df)

这将创建一个具有扩展列的数据框:

  locations_arrTime locations_arrTimeDiffMin locations_depTime  \
0                                                        06:32   
1             06:37                        1             06:40   
2             08:24                        1                     

  locations_depTimeDiffMin           locations_name locations_platform  \
0                        0  Spital am Pyhrn Bahnhof                  2   
1                        0  Windischgarsten Bahnhof                  2   
2                                    Linz/Donau Hbf               1A-B   

  locations_stationIdx locations_track number    name        date  
0                    0          R 3932         R 3932  01.10.2016  
1                    1                         R 3932  01.10.2016  
2                   22                         R 3932  01.10.2016 

处理多个 JSON 对象

对于包含多个对象的 JSON 文件,该方法取决于所需的数据结构。

保留单个列

要保留单个列(日期、数字、名称、位置),请使用以下命令:

df = pd.read_json('myJson.json')
df.locations = pd.DataFrame(df.locations.values.tolist())['name']
df = df.groupby(['date', 'name', 'number'])['locations'].apply(','.join).reset_index()

print(df)

这将对数据进行分组并连接位置:

        date    name number                                          locations
0  2016-01-10  R 3932         Spital am Pyhrn Bahnhof,Windischgarsten Bahnho...

扁平化数据结构

如果您更喜欢扁平化数据结构,您可以使用 json_normalize 并进行以下设置:

df = pd.read_json('myJson.json', orient='records', convert_dates=['date'])

print(df)

这将在单个表中输出数据:

  number    date                   name  ... locations.arrTimeDiffMin locations.depTimeDiffMin locations.platform
0             R 3932  2016-01-10  R 3932  ...                       0                         0                  2
1             R 3932  2016-01-10  R 3932  ...                       1                         0                  2
2             R 3932  2016-01-10  R 3932  ...                       1                         -                  1A-B
版本声明 本文转载于:1729739643如有侵犯,请联系[email protected]删除
最新教程 更多>
  • 为什么我的随机数在循环内是一致的?
    为什么我的随机数在循环内是一致的?
    理解迭代中一致的随机数在提供的代码片段中,可以观察到循环迭代中生成的随机数保持一致。具体来说,尽管循环旨在生成唯一值,但“carSetter”和“decider”变量在 15 次迭代中保留相同的值。此行为是由于循环内放置了 srand(time(0)) 造成的。它确定后续调用 rand() 时返回的...
    编程 发布于2024-12-23
  • 除了“if”语句之外:还有什么地方可以在不进行强制转换的情况下使用具有显式“bool”转换的类型?
    除了“if”语句之外:还有什么地方可以在不进行强制转换的情况下使用具有显式“bool”转换的类型?
    无需强制转换即可上下文转换为 bool您的类定义了对 bool 的显式转换,使您能够在条件语句中直接使用其实例“t”。然而,这种显式转换提出了一个问题:“t”在哪里可以在不进行强制转换的情况下用作 bool?上下文转换场景C 标准指定了四种值可以根据上下文转换为的主要场景bool:语句:if、whi...
    编程 发布于2024-12-23
  • 尽管代码有效,为什么 POST 请求无法捕获 PHP 中的输入?
    尽管代码有效,为什么 POST 请求无法捕获 PHP 中的输入?
    解决 PHP 中的 POST 请求故障在提供的代码片段中:action=''而不是:action="<?php echo $_SERVER['PHP_SELF'];?>";?>"检查 $_POST数组:表单提交后使用 var_dump 检查 $_POST 数...
    编程 发布于2024-12-23
  • 如何在 PHP 中组合两个关联数组,同时保留唯一 ID 并处理重复名称?
    如何在 PHP 中组合两个关联数组,同时保留唯一 ID 并处理重复名称?
    在 PHP 中组合关联数组在 PHP 中,将两个关联数组组合成一个数组是一项常见任务。考虑以下请求:问题描述:提供的代码定义了两个关联数组,$array1 和 $array2。目标是创建一个新数组 $array3,它合并两个数组中的所有键值对。 此外,提供的数组具有唯一的 ID,而名称可能重合。要求...
    编程 发布于2024-12-23
  • Bootstrap 4 Beta 中的列偏移发生了什么?
    Bootstrap 4 Beta 中的列偏移发生了什么?
    Bootstrap 4 Beta:列偏移的删除和恢复Bootstrap 4 在其 Beta 1 版本中引入了重大更改柱子偏移了。然而,随着 Beta 2 的后续发布,这些变化已经逆转。从 offset-md-* 到 ml-auto在 Bootstrap 4 Beta 1 中, offset-md-*...
    编程 发布于2024-12-23
  • 在 Go 中使用 WebSocket 进行实时通信
    在 Go 中使用 WebSocket 进行实时通信
    构建需要实时更新的应用程序(例如聊天应用程序、实时通知或协作工具)需要一种比传统 HTTP 更快、更具交互性的通信方法。这就是 WebSockets 发挥作用的地方!今天,我们将探讨如何在 Go 中使用 WebSocket,以便您可以向应用程序添加实时功能。 在这篇文章中,我们将介绍: WebSoc...
    编程 发布于2024-12-23
  • Java中处理InputMismatchException时如何防止无限循环?
    Java中处理InputMismatchException时如何防止无限循环?
    带有InputMismatchException的try/catch块中的无限循环:解决方案您的Java程序在尝试处理InputMismatchException时遇到无限循环/catch 块,同时从用户处获取整数输入。此行为源于这样的事实:捕获 InputMismatchException 后,扫...
    编程 发布于2024-12-23
  • 对于没有结果行的查询,我应该使用“DB.exec()”还是 Go 中的准备语句?
    对于没有结果行的查询,我应该使用“DB.exec()”还是 Go 中的准备语句?
    破译在 Golang 中使用 *DB.exec() 和准备语句的难题简介领域中使用 Go 和 Postgresql 进行数据库操作时,出现了一个挥之不去的问题:为什么要费心 DB.exec() 或当 Go 似乎自动化了它们的创建时准备好的语句?本文深入研究执行不返回行的操作的复杂性,并阐明使用准备好...
    编程 发布于2024-12-23
  • 如何使用 HttpClient 在 Java 中发出多部分/表单数据 POST 请求?
    如何使用 HttpClient 在 Java 中发出多部分/表单数据 POST 请求?
    使用 Java 发出多部分表单数据 POST 请求Apache Commons HttpClient 版本 4.0 的出现消除了执行多部分/表单数据 POST 请求的能力在 3.x 版本中是可能的。 HttpClient 团队解释说,多部分功能超出了他们的核心活动范围,并建议寻找替代库。寻找合适的 ...
    编程 发布于2024-12-23
  • HTML 格式标签
    HTML 格式标签
    HTML 格式化元素 **HTML Formatting is a process of formatting text for better look and feel. HTML provides us ability to format text without us...
    编程 发布于2024-12-23
  • 大批
    大批
    方法是可以在对象上调用的 fns 数组是对象,因此它们在 JS 中也有方法。 slice(begin):将数组的一部分提取到新数组中,而不改变原始数组。 let arr = ['a','b','c','d','e']; // Usecase: Extract till index p...
    编程 发布于2024-12-23
  • 如何使用 PHP 成功地将图像 Blob 插入 MySQL 数据库?
    如何使用 PHP 成功地将图像 Blob 插入 MySQL 数据库?
    使用 PHP 在 MySql 数据库中插入 Blob问题概述您是尝试使用 PHP 将图像存储在 MySQL 数据库中,但它没有按预期工作。图像数据未插入数据库。解决方案检查变量插值问题在您的查询时,您使用 file_get_contents() 函数来检索图像数据,但没有显式地将其结果连接到查询字符...
    编程 发布于2024-12-23
  • 如何使用 MySQL 查找今天生日的用户?
    如何使用 MySQL 查找今天生日的用户?
    如何使用 MySQL 识别今天生日的用户使用 MySQL 确定今天是否是用户的生日涉及查找生日匹配的所有行今天的日期。这可以通过一个简单的 MySQL 查询来实现,该查询将存储为 UNIX 时间戳的生日与今天的日期进行比较。以下 SQL 查询将获取今天有生日的所有用户: FROM USERS ...
    编程 发布于2024-12-23
  • 如何在 Go 中自定义解组非标准 JSON 时间格式?
    如何在 Go 中自定义解组非标准 JSON 时间格式?
    非标准 JSON 时间格式的自定义取消/编组处理包含非标准格式时间值的 JSON 数据时,内置 JSON 解码器可能会遇到错误。为了处理这种情况,可以实现自定义编组和解组函数。考虑以下 JSON:{ "name": "John", "...
    编程 发布于2024-12-23
  • 如何修复 macOS 上 Django 中的“配置不正确:加载 MySQLdb 模块时出错”?
    如何修复 macOS 上 Django 中的“配置不正确:加载 MySQLdb 模块时出错”?
    MySQL配置不正确:相对路径的问题在Django中运行python manage.py runserver时,可能会遇到以下错误:ImproperlyConfigured: Error loading MySQLdb module: dlopen(/Library/Python/2.7/site-...
    编程 发布于2024-12-23

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3