”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > C 中的不相交联合

C 中的不相交联合

发布于2024-11-08
浏览:869

Disjoint Unions in C

目前还不清楚如何在 C:
中表达此 Haskell 类型

data Tree = Leaf Int | Inner Tree Tree

与 Haskell 和 Rust 等语言不同,C 缺乏对
的内置支持 不相交联合。然而,如果我们愿意做一些额外的输入,它确实提供了代表它们所需的所有成分。

首先要认识到的是,不相交的并集由以下部分组成:

  • 许多不同的变体
  • 每个都有一些与之关联的数据

在我们的二叉树示例中,我们有两个变体:“叶子”和“内部”。叶变量存储单个整数(其数据),内部变量存储两棵树(代表其左子树和右子树)。

我们可以使用具有两个字段的结构体在 C 中表示这样的动物:

  1. “类型标签”,通常是整数,指示所表示的变体。
  2. A data 字段,用于存储与变体相关的数据。

使用枚举定义不同的变体类型标签很方便:

enum tree_type {
        TREE_LEAF,
        TREE_INNER,
};

存储数据怎么样?这就是工会要解决的问题类型。

工会

联合只是一块能够存储多种不同类型数据的内存。例如,这是一个可以存储 32 位 int 或 5 个字符的数组的联合。

union int_or_chars {
        int num;
        char letters[5];
};

类型为 union int_or_chars 的变量可以在任何特定时间保存 int 或 5 个字符的数组(只是不能同时保存):

union int_or_chars quux;

// We can store an int:
quux.num = 42;
printf("quux.num = %d\n", quux.num);
// => quux.num = 42

// Or 5 chars:
quux.letters[0] = 'a';
quux.letters[1] = 'b';
quux.letters[2] = 'c';
quux.letters[3] = 'd';
quux.letters[4] = 0;
printf("quux.letters = %s\n", quux.letters);
// => quux.letters = abcd

// But not both. The memory is "shared", so the chars saved above are
// now being interpreted as an int:
printf("quux.num = %x\n", quux.num);
// quux.num = 64636261

return 0;

像 union int_or_chars 这样的联合拥有足够大的内存块可供使用,可以容纳最大的成员。这是显示其工作原理的示意图:

  ----   ----   ----   ----   ----  
| byte |      |      |      |      |
  ----   ----   ----   ----   ----  
||
||

这有助于解释为什么在我们在 quux 中存储字符数组后打印 quux.num 会导致“垃圾”:它不是垃圾,而是字符串“abcd”被解释为整数。 (在我的机器上,quux.num 以十六进制打印为 64636261。字符“a”的 ASCII 值为 0x61,“b”的值为 0x62,“c”为 0x63,“d”为 0x64。由于我的处理器是小端字节序,所以顺序颠倒了。)

关于联合的最后一点,您可能会对 sizeof:
报告的大小感到惊讶

printf("%ld\n", sizeof(union int_or_chars));
// => 8

在我的机器上,类型 union int_or_chars 的大小为 8 个字节,而不是我们预期的 5 个字节。由于我的处理器架构规定的对齐要求,已添加一些填充。

返回二叉树

我们现在准备继续将二叉树类型从 Haskell 转换为 C。我们已经定义了一个枚举来表示变体的类型。现在我们需要一个联合来存储其数据:

union tree_data {
        int leaf;
        struct inner_data inner;
};

其中 struct inner_data 是包含“内部”变体的左右子级的结构:

struct inner_data {
        struct tree *left;
        struct tree *right;
};

请注意,“内部”变体维护指向其左右子节点的指针。间接是必要的,因为否则结构树将没有固定的大小。

这些部分就位后,我们就可以定义我们的树类型了:

enum tree_type {
        TREE_LEAF,
        TREE_INNER,
};

struct tree;
struct inner_data {
        struct tree *left;
        struct tree *right;
};

union tree_data {
        int leaf;
        struct inner_data inner;
};

// A representation of a binary tree.
struct tree {
        enum tree_type type;
        union tree_data data;
};

和树玩耍

让我们编写一些函数来构造树:

// Construct a leaf node.
struct tree *leaf(int value) {
        struct tree *t = malloc(sizeof(*t));
        t->type = TREE_LEAF;
        t->data.leaf = value;
        return t;
}

// Construct an inner node.
struct tree *inner(struct tree *left, struct tree *right) {
        struct tree *t = malloc(sizeof(*t));
        t->type = TREE_INNER;
        t->data.inner.left = left;
        t->data.inner.right = right;
        return t;
}

并打印它们:

void print_tree(struct tree *t) {
        switch (t->type) {
        case TREE_LEAF:
                printf("%d", t->data.leaf);
                return;
        case TREE_INNER:
                printf("(");
                print_tree(t->data.inner.left);
                printf(" ");
                print_tree(t->data.inner.right);
                printf(")");
                return;
        }
}

这使我们能够翻译 Haskell 表达式:

Inner (Inner (Leaf 1) (Leaf 2)) (Leaf 3)

到 C 中为:

inner(inner(leaf(1), leaf(2)), leaf(3));

例如:

struct tree *t = inner(inner(leaf(1), leaf(2)), leaf(3));
print_tree(t);
// => ((1 2) 3)

作为一个稍微有趣的例子,我们来翻译一下这个深度优先搜索函数:

-- Check if a value is in a tree.
search :: Int -> Tree -> Bool
search v (Leaf w) = v == w
search v (Inner l r) = search v l || search v r

使用我们的树类型:

// Check if a value is in a tree.
int search(int value, struct tree *t) {
        switch (t->type) {
        case TREE_LEAF:
                return t->data.leaf == value;
        case TREE_INNER:
                return (
                        search(value, t->data.inner.left) ||
                        search(value, t->data.inner.right)
                );
        }
}

这当然更冗长,但翻译过程很简单(编译器大概可以为我们做这种事情......)。

权衡

我们最后稍微离题了一些关于替代表示所涉及的权衡。具体来说,假设代替:

union tree_data {
        int leaf;
        struct inner_data inner;
};

我们使用:

union tree_data {
        int leaf;
        struct inner_data *inner;
        //                ^ The difference.
};

在第一种情况下,联合体包含一个结构体inner_data,而在第二种情况下,它存储一个指向该结构体的指针。因此,第一个联合体稍大一些,为 16 字节,而我的机器上的指针版本为 8 字节。不幸的是,受影响的不仅仅是内部节点:叶节点使用相同的 16 字节联合,但仅存储单个(4 字节)int。感觉有点浪费。

然而,这并不是故事的全部。每次访问内部节点的左子节点和右子节点时,我们都会为额外的间接寻址付出代价:读取不一定便宜,特别是如果指向的内存未缓存。

我怀疑这里提出的主要方法在大多数情况下是一个更好的起点,并且尝试削减一些字节(白色导致额外的读取)是不值得的,直到它是。

版本声明 本文转载于:https://dev.to/wjlewis/disjoint-unions-in-c-4i9i如有侵犯,请联系[email protected]删除
最新教程 更多>
  • 如何检测 Go 标准输入 (Stdin) 中的数据可用性?
    如何检测 Go 标准输入 (Stdin) 中的数据可用性?
    使用 Go 检测标准输入 (Stdin) 中的数据可用性在 Go 中,可以使用以下技术检查标准输入流 (os.Stdin) 中的数据:验证其文件大小。它的工作原理如下:os.Stdin 可以像任何常规文件一样对待,允许我们检查其属性。为此,我们使用 os.Stdin.Stat() 检索 FileIn...
    编程 发布于2024-11-08
  • Wasp:Web 开发中 Django 的 JavaScript 答案
    Wasp:Web 开发中 Django 的 JavaScript 答案
    Wasp v Django: Building a full stack application just got a lot easier Hey, I’m Sam, a backend engineer with a lot of experience with Django....
    编程 发布于2024-11-08
  • 如何在没有键盘中断的情况下通过按键中断 While 循环?
    如何在没有键盘中断的情况下通过按键中断 While 循环?
    通过按键中断 While 循环在使用 while 循环读取串行数据并将其写入 CSV 文件的场景中,您可能希望为用户提供终止循环以停止数据收集的选项。本文探讨了在不显式使用键盘中断的情况下实现此类功能的技术。一种简单的方法是利用 try- except 块来处理 KeyboardInterrupt ...
    编程 发布于2024-11-08
  • 周 oot 训练营学习
    周 oot 训练营学习
    我决定迈出大胆的一步,参加由 LuxDevHQ 组织的我的第一个数据职业训练营。这是一个为期 5 周的训练营,旨在培养实践数据技能。该训练营旨在让人们接触至少 4 个专业领域的各种数据技能。 第一周以信息会议开始,我进行了项目定向,并​​向我介绍了该项目并了解了整个项目的期望。 在这第一周,我学到了...
    编程 发布于2024-11-08
  • 如何使用 Homebrew 和 jenv 在 Mac OS X 上管理多个 Java 版本?
    如何使用 Homebrew 和 jenv 在 Mac OS X 上管理多个 Java 版本?
    在 Mac OS X 上管理多个 Java 版本由于 Java 管理其安装的方式,在 Mac OS X 上安装多个 Java 版本可能是一项挑战。不过,有一个解决方案可以让您轻松安装和管理不同的 Java 版本:Homebrew。使用 Homebrew 和 jenvHomebrew 是一个包管理器,...
    编程 发布于2024-11-08
  • 如何创建 React 应用程序?安装与环境设置
    如何创建 React 应用程序?安装与环境设置
    在开始使用 React 构建应用程序之前,拥有正确的开发环境非常重要。以下是帮助您入门的分步指南: 步骤 1. 安装 Node.js 和 npm 设置 React 环境的第一步是安装 Node.js,因为它提供了在浏览器外部执行代码所需的 JavaScript 运行时。当您安装 Node.js 时,...
    编程 发布于2024-11-08
  • python 并发.futures
    python 并发.futures
    未来 Future 是一个容器,可以保存计算结果或计算期间发生的错误。创建 future 时,它​​以 PENDING 状态开始。该库不打算手动创建此对象,除非出于测试目的。 import concurrent.futures as futures f = futures.Futu...
    编程 发布于2024-11-08
  • 使用纯 Javascript 只需几行即可实现飞向购物车的动画。
    使用纯 Javascript 只需几行即可实现飞向购物车的动画。
    最近,我偶然发现了一个旧教程,展示了使用 jQuery 实现飞行到购物车的动画。我想通过使用纯 JavaScript 实现相同的效果来挑战自己。 我创建了一个包含产品和购物车图标的简单布局。样式并不重要,所以我们不会在这里讨论它。 诀窍是克隆产品图像,将其添加到产品元素之前。然后计算克隆图像和购物车...
    编程 发布于2024-11-08
  • Bokeh 是一个有趣的 Python 数据可视化数据工具
    Bokeh 是一个有趣的 Python 数据可视化数据工具
    数据可视化在解释大量信息方面发挥着关键作用。 Bokeh 等工具已成为构建交互式仪表板和报告的流行解决方案。每个工具都具有独特的优势,具体取决于您项目的复杂性和您首选的编程语言。在本文中,我们将深入研究每个工具,然后重点关注 Bokeh,包括实践示例和云中的部署。 以便... 什么是散景? Boke...
    编程 发布于2024-11-08
  • django-components v 模板现在与 Vue 或 React 相当
    django-components v 模板现在与 Vue 或 React 相当
    嘿,我是 Juro,我是 django-components 的维护者之一。在 v0.90-0.94 版本中,我们添加了一些功能,使模板中的组件使用更加灵活,类似于 JSX / Vue。 (此信息已经有点过时了(一个月前发布;最新的是 v0.101),因为我正忙着添加对 JS / CSS 变量、Ty...
    编程 发布于2024-11-08
  • 在 GitHub-echo 中实现 TOML 配置支持
    在 GitHub-echo 中实现 TOML 配置支持
    介绍 最近,我有机会通过添加对 TOML 配置文件的支持来增强 github-echo 命令行工具。此功能允许用户在 .github-echo-config.toml 文件中设置持久默认选项,从而减少每次使用该工具时手动输入重复配置的需要。在这篇文章中,我将向您介绍我在该功能上的经...
    编程 发布于2024-11-08
  • 如何使用 SimpleXML 和 DOMDocument 删除 XPath 节点?
    如何使用 SimpleXML 和 DOMDocument 删除 XPath 节点?
    SimpleXML:删除 XPath 节点在本文中,我们将探讨如何使用以下方法有效地从 XML 文档中删除父节点: SimpleXML 和 XPath。了解 SimpleXML限制提供的代码尝试使用 SimpleXML 在通过 XPath 找到父节点后删除它。然而,SimpleXML 的 unset...
    编程 发布于2024-11-08
  • 创建一个 React Hook 以任意角度旋转图像
    创建一个 React Hook 以任意角度旋转图像
    在Web开发中,您可能需要旋转图像,这在CSS中很容易做到。像这样的简单代码变换:rotate(90deg);。但是如果我们想用 JS 来做呢? TLDR 将图像绘制到浏览器环境中的画布上并旋转它。但在此之前,我们需要做一些数学运算来保持原始图像的长宽比。 核 假设我...
    编程 发布于2024-11-08
  • Lithe 中间件:它是如何工作的以及如何创建自己的中间件
    Lithe 中间件:它是如何工作的以及如何创建自己的中间件
    中间件提供了一种方便的机制来检查和过滤进入应用程序的 HTTP 请求。 例如,Lithe 包含检查用户是否经过身份验证的中间件。如果没有,中间件会将用户重定向到登录屏幕。如果用户通过身份验证,中间件将允许请求继续。 中间件如何在 Lithe 中工作 在 Lithe 中,中间件是能够访...
    编程 发布于2024-11-08
  • 如何在 JavaScript 中创建具有重复元素的数组?
    如何在 JavaScript 中创建具有重复元素的数组?
    JavaScript 中重复元素的数组创建具有多次重复的相同元素的数组在各种编程场景中至关重要。在 Python 中,这可以通过列表乘法来实现,如 [2] * 5 中所示。但是,此功能在 JavaScript 数组中不能直接使用。自定义函数方法为了满足这种需求,一种方法是创建自定义函数,例如问题中提...
    编程 发布于2024-11-08

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3