”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 使用 AI 创建最快且精确的发票数据提取器以进行结构输出

使用 AI 创建最快且精确的发票数据提取器以进行结构输出

发布于2024-11-01
浏览:582

Create the fastest and precise invoice data extractor for structural output using AI

使用 LlamaExtract 和 Pydantic 模型提取商店收据

在本文中,我们将探索如何使用 LlamaExtract 与 Pydantic 模型中的模式相结合,以便从商店收据中提取结构化数据。这种方法有助于系统地组织收据信息,使其更易于分析和管理。

设置

首先,确保您安装了 llama-extract 客户端库。使用以下命令:

pip install llama-extract pydantic

注意:如果您看到有关更新 pip 的通知,您可以使用提供的命令进行更新。

首先,登录并从 Llama Index Cloud 免费获取 api-key

为您的 LlamaExtract API 密钥设置环境变量:

import os

os.environ["LLAMA_CLOUD_API_KEY"] = "YOUR LLAMA INDEX CLOUD API HERE"

加载数据

对于此示例,假设我们有一个 PDF 格式的商店收据数据集。将这些文件放在名为receipts 的目录中。

DATA_DIR = "data/receipts"
fnames = os.listdir(DATA_DIR)
fnames = [fname for fname in fnames if fname.endswith(".pdf")]
fpaths = [os.path.join(DATA_DIR, fname) for fname in fnames]
fpaths

输出应列出收据的文件路径:

['data/receipts/receipt.pdf']

定义 Pydantic 模型

我们将使用 Pydantic 定义我们的数据模型,这将告诉 API 我们期望或想要从 PDF 中提取哪些字段/数据。对于商店收据,我们可能有兴趣提取商店名称、日期、总金额和购买的商品列表。

from pydantic import BaseModel
from typing import List

class Item(BaseModel):
    name: str
    quantity: int
    price: float

class Receipt(BaseModel):
    store_name: str
    date: str
    total_amount: float
    items: List[Item]

创建架构

现在,我们可以使用 Pydantic 模型在 LlamaExtract 中定义提取模式。

from llama_extract import LlamaExtract

extractor = LlamaExtract(verbose=True)
schema_response = await extractor.acreate_schema("Receipt Schema", data_schema=Receipt)
schema_response.data_schema

输出架构应类似于以下内容:

{
    'type': 'object',
    '$defs': {
        'Item': {
            'type': 'object',
            'title': 'Item',
            'required': ['name', 'quantity', 'price'],
            'properties': {
                'name': {'type': 'string', 'title': 'Name'},
                'quantity': {'type': 'integer', 'title': 'Quantity'},
                'price': {'type': 'number', 'title': 'Price'}
            }
        }
    },
    'title': 'Receipt',
    'required': ['store_name', 'date', 'total_amount', 'items'],
    'properties': {
        'store_name': {'type': 'string', 'title': 'Store Name'},
        'date': {'type': 'string', 'title': 'Date'},
        'total_amount': {'type': 'number', 'title': 'Total Amount'},
        'items': {
            'type': 'array',
            'title': 'Items',
            'items': {'$ref': '#/$defs/Item'}
        }
    }
}

运行提取

定义了架构后,我们现在可以从收据文件中提取结构化数据。通过指定收据作为响应模型,我们确保提取的数据经过验证和结构化。

responses = await extractor.aextract(
    schema_response.id, fpaths, response_model=Receipt
)

如果需要,您可以访问原始 JSON 输出:

data = responses[0].data
print(data)

JSON 输出示例:

{
    'store_name': 'ABC Electronics',
    'date': '2024-08-05',
    'total_amount': 123.45,
    'items': [
        {'name': 'Laptop', 'quantity': 1, 'price': 999.99},
        {'name': 'Mouse', 'quantity': 1, 'price': 25.00},
        {'name': 'Keyboard', 'quantity': 1, 'price': 50.00}
    ]
}

结论

在本文中,我们演示了如何将 LlamaExtract 与 Pydantic 模型结合使用来定义数据模式并从商店收据中提取结构化数据。这种方法可确保提取的信息组织良好且经过验证,从而更易于处理和分析。

这也可用于许多案例、发票、收据、报告等。

快乐编码!!

你有项目吗?您希望我协助您给我发电子邮件吗?: [email protected]

有疑问或想成为第一个了解我的帖子的人:-
在 LinkedIn 上关注 ✅ 我?
在 Twitter/X 上关注 ✅ 我?

版本声明 本文转载于:https://dev.to/wmisingo/create-the-fastest-and-precise-invoice-data-extractor-for-structural-output-using-ai-pe1?1如有侵犯,请联系[email protected]删除
最新教程 更多>
  • 您应该避免的错误(以及如何修复它们)
    您应该避免的错误(以及如何修复它们)
    作为一名 React 开发人员,很容易陷入某些编码模式,这些模式一开始看起来很方便,但最终可能会导致问题。在这篇博文中,我们将探讨 5 个常见的 React 错误,并讨论如何避免它们,确保您的代码保持高效、可维护和可扩展。 1. 滥用关键道具 错误: {myList.map((ite...
    编程 发布于2024-11-07
  • 如何在 PHP 中访问 JavaScript 变量值?
    如何在 PHP 中访问 JavaScript 变量值?
    在 PHP 中使用 JavaScript 变量值使用同时涉及 JavaScript 和 PHP 的 Web 应用程序时,通常需要在两者之间交换数据两种语言。然而,由于语言的执行环境不同,直接在 PHP 中访问 JavaScript 变量是不可能的。PHP 在服务器端执行,而 JavaScript 在...
    编程 发布于2024-11-07
  • Popver API VS 对话框模态:相同但不同
    Popver API VS 对话框模态:相同但不同
    我在阅读一些科技新闻博客时偶然发现标题 Popover API 登陆 Baseline。我很困惑,在我最近深入前端开发期间,我最近很难习惯在 HTML 中使用 Elements。在浏览博客时,我一直对到目前为止我如何使用该元素感到困惑。 长话短说 选择: 需要用户焦点的模态弹出窗口...
    编程 发布于2024-11-07
  • Go中不嵌入结构体可以实现方法继承吗?
    Go中不嵌入结构体可以实现方法继承吗?
    嵌入式结构:方法继承的探索理解 Go 中的方法继承In在 Go 中,将方法从一种类型继承到另一种类型的能力主要是通过嵌入结构来实现的。此技术涉及将一个结构嵌入另一个结构,允许外部结构访问和利用嵌入结构的方法。嵌入结构的示例考虑以下内容代码片段:type Properties map[string]i...
    编程 发布于2024-11-07
  • 如何在 PHP 中的 Foreach 循环中检索数组键
    如何在 PHP 中的 Foreach 循环中检索数组键
    在 Foreach 循环期间检索数组键:PHP在 PHP 中使用数组时,通常需要检索其中的键和值foreach 循环。 key() 函数提供了一种在迭代期间访问当前键的便捷方法。但是,在某些情况下,它可能不会产生所需的结果。考虑以下代码,其目的是从示例数组生成 HTML 表:foreach($sam...
    编程 发布于2024-11-07
  • 在 JavaScript 中创建对象的方法
    在 JavaScript 中创建对象的方法
    介绍 在 JavaScript 中创建对象的方法有很多种。 对象字面量 Object() 构造函数 Object.create() 构造函数 ES6 类 对象字面量 这可能是在 JavaScript 中创建对象最快、最简单的方法。这也称为对象初始值设定项,是一个由零...
    编程 发布于2024-11-07
  • 如何在 JavaScript 中扩展自定义异常的错误对象?
    如何在 JavaScript 中扩展自定义异常的错误对象?
    扩展 JavaScript 中的错误对象在 JavaScript 中抛出异常时,可能希望扩展内置 Error 对象以创建自定义错误类型。这允许更具体和信息丰富的异常处理。在 JavaScript 中,继承不是通过子类化与 Python 不同,在 Python 中,异常通常是从 Exception 基...
    编程 发布于2024-11-07
  • MySQL如何保证并发操作时数据的完整性?
    MySQL如何保证并发操作时数据的完整性?
    MySQL 并发:确保数据完整性如果您的 MySQL 数据库使用 InnoDB 存储引擎,您可能会担心在执行过程中潜在的并发问题。同时记录更新或插入。本文探讨了 MySQL 如何处理并发以及是否需要在应用程序中加入额外的处理。MySQL 的并发处理MySQL 采用原子性,这意味着单独的 SQL 语句...
    编程 发布于2024-11-07
  • 如何使用 Go 在 SQL 查询中有效连接字符串和值?
    如何使用 Go 在 SQL 查询中有效连接字符串和值?
    在 Go 中有效地制作 SQL 查询在 Go 中将字符串与文本 SQL 查询中的值连接起来可能有点棘手。与 Python 不同,Go 的字符串格式化语法行为不同,导致常见错误,如此处遇到的错误。元组语法错误初始代码片段尝试使用 Python -style 元组,Go 中不支持。这会导致语法错误:qu...
    编程 发布于2024-11-07
  • 为什么 json_encode() 无法使用 Latin1 编码对 MySQL 数据库中的重音字符进行编码?
    为什么 json_encode() 无法使用 Latin1 编码对 MySQL 数据库中的重音字符进行编码?
    MySQL 中 UTF-8 字符的 JSON 编码难题当尝试使用 latin1_swedish_ci 编码从数据库中检索重音字符并使用 json_encode() 将它们编码为 JSON 时,结果可能出乎意料。预期结果(例如“Abord â Plouffe”)会转换为“null”,从而使编码的 JS...
    编程 发布于2024-11-07
  • 如何在 MySQL 中将行转置为列:综合指南
    如何在 MySQL 中将行转置为列:综合指南
    在 MySQL 中将行转换为列在 MySQL 查询中将行转换为列需要在应用程序中执行复杂的查询或手动操作。GROUP_CONCAT 解决方案虽然 GROUP_CONCAT 可以将行转换为单列,但它不提供整个结果集所需的转置。手动查询方法对于更复杂的转置,需要细致的查询,从原始行手动构造每一列。复杂查...
    编程 发布于2024-11-07
  • 如何解决iOS后台模式下未收到GCM通知的问题
    如何解决iOS后台模式下未收到GCM通知的问题
    当应用程序在 iOS 上处于后台模式时未收到 GCM 通知当 iOS 在后台收到通知但不处理时,会出现此问题它们在用户界面中。要解决此问题,请确保您的应用:启用后台推送通知:检查您的应用是否已请求并获得在后台接收推送通知的权限。设置徽章应用程序图标:验证是否在应用程序的“设置”>“通知”部分中选择了...
    编程 发布于2024-11-07
  • 为什么在 Windows 7 中使用 CLASSPATH 时出现 ClassNotFoundException?
    为什么在 Windows 7 中使用 CLASSPATH 时出现 ClassNotFoundException?
    尽管使用 CLASSPATH 环境变量仍解决 java.lang.ClassNotFoundException在 Windows 7 中尝试使用 Java 连接到 MySQL 数据库时,设置 CLASSPATH 环境变量以包含 JDBC 驱动程序 jar 文件的路径似乎无法解决 java.lang....
    编程 发布于2024-11-07
  • 开发人员需要了解免费外汇 API
    开发人员需要了解免费外汇 API
    如果您是一名开发人员,您一定正在寻找可以帮助您更轻松地工作的工具,对吗?免费的外汇 API 就是其中之一!它使您无需支付任何费用即可获取外汇汇率。但是,许多开发人员对这些 API 不太了解。因此,本文旨在解释什么是免费外汇 API、它为何有用以及如何为您的项目选择一个 API。 什么是免费外汇 A...
    编程 发布于2024-11-07
  • 如何使用 JavaScript 将字符串中每个单词的首字母大写?
    如何使用 JavaScript 将字符串中每个单词的首字母大写?
    使用 JavaScript 将字符串中每个单词的首字母大写在 JavaScript 中,将字符串中每个单词的首字母大写可以可以通过多种方法来实现。一种常见的方法是使用将给定字符串转换为标题大小写的函数。让我们探索一个演示此技术的代码示例:function titleCase(str) { var...
    编程 发布于2024-11-07

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3