”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 为什么 Pandas DataFrame 中的字符串在转换后仍显示为对象?

为什么 Pandas DataFrame 中的字符串在转换后仍显示为对象?

发布于2024-11-08
浏览:424

 Why do Strings in Pandas DataFrames Appear as Objects Even After Conversion?

为什么 DataFrame 中的字符串存储为对象?

尽管将包含字符串的 DataFrame 列显式转换为字符串数据类型,Python 的 Pandas 库仍可能将它们报告为对象。这种差异是由于 NumPy 的底层数据结构造成的。

NumPy 使用 ndarray 来存储数据数组,ndarray 中的每个元素都有固定数量的字节。对于整数(int64)和浮点数(float64),每个元素占用8个字节。然而,字符串的长度是可变的,因此将它们直接存储在 ndarray 中是不切实际的。

为了适应这一点,Pandas 使用对象 ndarray 来存储指向对象的指针。这些对象包含实际的字符串值。因此,对象 ndarray 的大小不确定,并表示为“对象”数据类型。

示例:

考虑一个包含四个 64 位的 int64 数组整数和一个包含四个指向三个字符串对象的指针的对象数组:

int64 array: | 1 | 2 | 3 | 4 |
object array: | pointer to "hello" | pointer to "world" | pointer to "!" |

Visualization:

 --------- ----------- 
| int64    |  object   |
|--------- -----------|
| 1        | hello     |
| 2        | world     |
| 3        | !         |
| 4        | null      |
 --------- ----------- 

在此表示中,int64 数组占用固定的空间量,每个元素为 8 个字节。另一方面,对象数组存储指向不同大小的对象的指针,因此是“对象”数据类型。

最新教程 更多>
  • Javascript 基元实际上是对象吗?
    Javascript 基元实际上是对象吗?
    Javascript 基元与对象:澄清概念尽管普遍认为“Javascript 中几乎所有内容都是对象”,但并非所有内容语言中的实体遵循这个定义。基元和对象之间的区别需要澄清。基元与对象相反,基元是以其基本形式存在的不可变值。它们缺少方法和属性,并包括以下数据类型:StringsNumbersBool...
    编程 发布于2024-11-15
  • 为什么 C++ 中的联合内禁止使用 `std::string` 对象?
    为什么 C++ 中的联合内禁止使用 `std::string` 对象?
    为什么 std::string 在联合中被禁止在 C 编程领域,联合是一种特殊的结构,它允许在联合中存储各种数据类型共享内存地址。然而,当涉及联合中的成员时,有一个有趣的限制:禁止具有非平凡构造函数的类,包括 std::string。非平凡构造函数的问题根本原因可以追溯到工会的性质。联合体中的成员从...
    编程 发布于2024-11-15
  • Bootstrap 4 Beta 中的列偏移发生了什么?
    Bootstrap 4 Beta 中的列偏移发生了什么?
    Bootstrap 4 Beta:列偏移的删除和恢复Bootstrap 4 在其 Beta 1 版本中引入了重大更改柱子偏移了。然而,随着 Beta 2 的后续发布,这些变化已经逆转。从 offset-md-* 到 ml-auto在 Bootstrap 4 Beta 1 中, offset-md-*...
    编程 发布于2024-11-15
  • 我们能否在正则表达式中实现真正的可变长度向后查找?
    我们能否在正则表达式中实现真正的可变长度向后查找?
    正则表达式的可变长度回顾断言替代方案正则表达式中的可变长度回顾断言,用 (?带有正则表达式模块的 PythonPython 正则表达式模块提供对可变长度后向断言的支持。 import regex m = regex.search('(?<!foo.*)bar', 'f00bar') p...
    编程 发布于2024-11-15
  • 如何在 PHP 中组合两个关联数组,同时保留唯一 ID 并处理重复名称?
    如何在 PHP 中组合两个关联数组,同时保留唯一 ID 并处理重复名称?
    在 PHP 中组合关联数组在 PHP 中,将两个关联数组组合成一个数组是一项常见任务。考虑以下请求:问题描述:提供的代码定义了两个关联数组,$array1和$array2。目标是创建一个新数组 $array3,它合并两个数组中的所有键值对。 此外,提供的数组具有唯一的 ID,而名称可能重合。要求是构...
    编程 发布于2024-11-15
  • 如何修复 macOS 上 Django 中的“配置不正确:加载 MySQLdb 模块时出错”?
    如何修复 macOS 上 Django 中的“配置不正确:加载 MySQLdb 模块时出错”?
    MySQL配置不正确:相对路径的问题在Django中运行python manage.py runserver时,可能会遇到以下错误:ImproperlyConfigured: Error loading MySQLdb module: dlopen(/Library/Python/2.7/site-...
    编程 发布于2024-11-15
  • 如何使用 Twitter Bootstrap 对齐表格中的文本?
    如何使用 Twitter Bootstrap 对齐表格中的文本?
    Twitter Bootstrap 中的表格文本对齐在 Twitter 的 Bootstrap 框架中,您可以使用指定的文本对齐类来对齐表格内的文本。 Bootstrap 3text-left:左对齐文本text-center:居中对齐文本text-right:右对齐文本Bootstrap 4tex...
    编程 发布于2024-11-15
  • 除了“if”语句之外:还有什么地方可以在不进行强制转换的情况下使用具有显式“bool”转换的类型?
    除了“if”语句之外:还有什么地方可以在不进行强制转换的情况下使用具有显式“bool”转换的类型?
    无需强制转换即可上下文转换为 bool您的类定义了对 bool 的显式转换,使您能够在条件语句中直接使用其实例“t”。然而,这种显式转换提出了一个问题:“t”在哪里可以在不进行强制转换的情况下用作 bool?上下文转换场景C 标准指定了四种值可以根据上下文转换为 bool 的主要场景:语句:if、w...
    编程 发布于2024-11-15
  • 如何使 CSS 中的空表格单元格的边框可见?
    如何使 CSS 中的空表格单元格的边框可见?
    我可以在 CSS 中使空单元格的边框可见吗?在 Internet Explorer 7 中,默认情况下可能不会显示空单元格的边框。不过,有几种方法可以解决此问题。使用不间断空格如果可行,请插入不间断空格 ( )进入空单元格可以强制浏览器渲染带有边框的单元格。纯 CSS 解决方案对于纯 CS...
    编程 发布于2024-11-15
  • 如何将 Python 列表转换为 CSV 文件?
    如何将 Python 列表转换为 CSV 文件?
    将 Python 列表列表导出到 CSV 文件您的目标是将 Python 列表列表转换为 CSV 文件,确保每个子列表中都会保留不同类型(浮点型、整数型、字符串型)的数据。所需的 CSV 格式涉及使用逗号分隔每个子列表中的元素并垂直对齐子列表。要实现此目的,您可以利用 Python 的内置 csv ...
    编程 发布于2024-11-15
  • 测试限制:了解软件测试的边界
    测试限制:了解软件测试的边界
    软件测试是确保软件质量、稳定性和功能的开发过程的重要组成部分。然而,尽管测试很重要,但它也有其局限性。虽然它可以揭示缺陷,但它不能保证应用程序完全没有错误。了解这些限制有助于企业和开发人员设定切合实际的期望并优化他们的测试流程。在本文中,我们将探讨软件测试的主要局限性及其带来的挑战。 无法测试每个...
    编程 发布于2024-11-15
  • 如何有效地将文件加载到`std::vector`中?
    如何有效地将文件加载到`std::vector`中?
    高效地将文件加载到 std::vector高效地将文件加载到 std::vector,必须避免不必要的复制和内存重新分配。虽然利用 Reserve 和 read() 的原始方法可能看起来很直接,但单独的 Reserve() 并不会改变向量的容量。使用迭代器的规范方法:规范方法使用输入流迭代器来方便地...
    编程 发布于2024-11-15
  • 如何在 Go 中将数组元素直接解压为变量?
    如何在 Go 中将数组元素直接解压为变量?
    在 Go 中解包数组元素Go 缺乏将数组元素直接解包到 Python 中的变量的便捷语法。虽然提问者使用中间变量的初始方法有效,但它可能会导致代码混乱,尤其是在复杂的场景中。多个返回值为了解决这个问题,建议使用解决方案是创建一个返回多个值的函数。例如,要拆分字符串并将结果解压为两个变量,可以使用如下...
    编程 发布于2024-11-15
  • “n:m”和“1:n”关系如何塑造数据库设计?
    “n:m”和“1:n”关系如何塑造数据库设计?
    理解关系数据库设计:“n:m”和“1:n”的意义在数据库设计中,符号“ n:m”和“1:n”在表示表或实体之间的关系方面起着至关重要的作用。这些符号表示它们关联的基数。"n:m" 关系:多对多“n:m”关系表示多对多两个数据实体之间的对多关联。这意味着对于一个表中的每个实体,它可...
    编程 发布于2024-11-15
  • 如何在 Java 中查找重定向的 URL?
    如何在 Java 中查找重定向的 URL?
    在 Java 中查找重定向 URL在 Java 中访问网页时,处理 URL 重定向到备用位置的情况至关重要。要确定重定向的 URL,您可以使用 URL 和 URLConnection 类。使用 URLConnection.getUrl()使用 URLConnection 建立连接后,您可以检索连接通...
    编程 发布于2024-11-15

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3