”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 使用 LlamaIndex.ts 和 Azure OpenAI 构建 RAG 应用程序:入门!

使用 LlamaIndex.ts 和 Azure OpenAI 构建 RAG 应用程序:入门!

发布于2024-11-08
浏览:676

随着人工智能继续塑造我们的工作方式以及与技术交互的方式,许多企业正在寻找在智能应用程序中利用自己的数据的方法。如果你使用过 ChatGPT 或 Azure OpenAI 等工具,那么你已经熟悉生成式 AI 如何改进流程并增强用户体验。然而,为了真正定制和相关的响应,您的应用程序需要合并您的专有数据。

这就是检索增强生成 (RAG) 的用武之地,它提供了一种结构化方法,将数据检索与人工智能驱动的响应相集成。借助 LlamaIndex 等框架,您可以轻松地将这种功能构建到您的解决方案中,从而释放业务数据的全部潜力。

Building a RAG app with LlamaIndex.ts and Azure OpenAI: Getting started!

想要快速运行并探索该应用程序?点击这里。

什么是 RAG - 检索增强生成?

检索增强生成 (RAG) 是一种神经网络框架,通过包含检索组件来访问相关信息并集成您自己的数据,从而增强 AI 文本生成。它由两个主要部分组成:

  • Retriever:密集检索器模型(例如,基于 BERT),用于搜索大型文档语料库以查找与给定查询相关的相关段落或信息。
  • 生成器:序列到序列模型(例如,基于 BART 或 T5),它将查询和检索到的文本作为输入,并生成连贯的、上下文丰富的响应。

检索器查找相关文档,生成器使用它们来创建更准确、信息更丰富的响应。这种组合允许 RAG 模型有效地利用外部知识,提高生成文本的质量和相关性。

LlamaIndex 如何实现 RAG?

要使用 LlamaIndex 实现 RAG 系统,请遵循以下一般步骤:

数据摄取:

  • 使用 SimpleDirectoryReader 等文档加载器将文档加载到 LlamaIndex.ts 中,这有助于从 PDF、API 或 SQL 数据库等各种来源导入数据。
  • 使用 SentenceSplitter 将大型文档分解为更小的、可管理的块。

索引创建:

  • 使用 VectorStoreIndex 创建这些文档块的向量索引,从而允许基于嵌入进行高效的相似性搜索。
  • 对于复杂的数据集,可以选择使用递归检索技术来管理分层结构化数据并根据用户查询检索相关部分。

查询引擎设置:

  • 使用asQueryEngine将向量索引转换为查询引擎,并使用similarityTopK等参数来定义应检索多少个顶级文档。
  • 对于更高级的设置,创建一个多代理系统,其中每个代理负责特定文档,并且顶级代理协调整个检索过程。

检索和生成:

  • 通过定义根据用户查询检索相关文档块的目标函数来实现 RAG 管道。
  • 使用 RetrieverQueryEngine 执行实际的检索和查询处理,以及可选的后处理步骤,例如使用 CohereRerank 等工具对检索到的文档重新排名。

作为实际示例,我们提供了一个示例应用程序来演示使用 Azure OpenAI 的完整 RAG 实现。

实用 RAG 示例应用程序

我们现在将重点使用 LlamaIndex.ts(LlamaIndex 的 TypeScipt 实现)和 Azure OpenAI 构建 RAG 应用程序,并将其部署为 Azure 容器应用程序上的无服务器 Web 应用程序。

运行示例的要求

  • Azure Developer CLI (azd):一个命令行工具,可轻松部署整个应用程序,包括后端、前端和数据库。
  • Azure 帐户:您需要一个 Azure 帐户来部署应用程序。获取一个带有一些积分的免费 Azure 帐户即可开始使用。

您将在 GitHub 上找到入门项目。我们建议您分叉此模板,以便您可以在需要时自由编辑它:

Building a RAG app with LlamaIndex.ts and Azure OpenAI: Getting started!

高层架构

入门项目应用程序基于以下架构构建:

  • Azure OpenAI:处理用户查询的 AI 提供程序。
  • LlamaIndex.ts:帮助提取、转换和矢量化内容 (PDF) 以及创建搜索索引的框架。
  • Azure Container Apps:托管无服务器应用程序的容器环境。
  • Azure 托管身份:确保一流的安全性并消除处理凭据和 API 密钥的需要。

Building a RAG app with LlamaIndex.ts and Azure OpenAI: Getting started!

有关部署哪些资源的更多详细信息,请检查我们所有示例中提供的 infra 文件夹。

用户工作流程示例

示例应用程序包含两个工作流程的逻辑:

  1. 数据摄取:获取数据、向量化并创建搜索索引。如果您想添加更多文件,例如 PDF 或 Word 文件,您应该在此处添加它们。

      npm run generate
    
  2. 服务提示请求:应用程序接收用户提示,将其发送到 Azure OpenAI,并使用向量索引作为检索器来增强这些提示。

运行示例

运行示例之前,请确保您已预配必要的 Azure 资源。

要在 GitHub Codespace 中运行 GitHub 模板,只需单击
Building a RAG app with LlamaIndex.ts and Azure OpenAI: Getting started!

在您的 Codespaces 实例中,从终端登录您的 Azure 帐户:

azd auth login

使用单个命令配置、打包示例应用程序并将其部署到 Azure:

azd up

要在本地运行并尝试应用程序,请安装 npm 依赖项并运行应用程序:

npm install
npm run dev

应用程序将在您的 Codespaces 实例中的端口 3000 或浏览器中的 http://localhost:3000 上运行。

结论

本指南演示了如何使用 LlamaIndex.ts 和 Azure OpenAI 构建部署在 Microsoft Azure 上的无服务器 RAG(检索增强生成)应用程序。通过遵循本指南,您可以利用 Azure 的基础架构和 LlamaIndex 的功能来创建强大的 AI 应用程序,这些应用程序可根据您的数据提供上下文丰富的响应。

我们很高兴看到您使用这个入门应用程序构建的内容。请随意 fork 它并喜欢 GitHub 存储库以接收最新的更新和功能。

版本声明 本文转载于:https://dev.to/azure/building-a-rag-app-with-llamaindexts-and-azure-openai-getting-started-3pgb?1如有侵犯,请联系[email protected]删除
最新教程 更多>
  • 将事件映射器与 Rimmel.js 结合使用:简单介绍
    将事件映射器与 Rimmel.js 结合使用:简单介绍
    如果您想提高代码的整体质量,您可能希望使数据模型与底层视图完全解耦。 功能响应式框架或 UI 库(如 Rimmel.js)完全支持 Observables,除了鲜为人知的设计之外,还使您能够将模型定义为 Observable 流(例如:简单的数据输入、数据输出流)模式,即事件适配器。 事件适配器帮助...
    编程 发布于2024-11-08
  • 为什么 C++ 中未指定操作数的求值顺序?
    为什么 C++ 中未指定操作数的求值顺序?
    C 中操作数的求值顺序 在数学表达式中,操作数的求值顺序通常被假定为固定的。然而,在 C 等编程语言中,计算顺序可能未指定,从而导致意外结果。考虑表达式 a b。在此表达式中,操作数 a 和 b 可以按任意顺序求值。这称为“未指定的求值顺序”。C 标准指定函数参数和各个运算符的操作数的求值顺序是未指...
    编程 发布于2024-11-08
  • 如何将 CSV 文件导入到 phpMyAdmin 中的现有表中?
    如何将 CSV 文件导入到 phpMyAdmin 中的现有表中?
    使用现有表列将 CSV 导入 phpMyAdmin可以通过 phpMyAdmin 将 CSV 文件导入现有数据库表。要避免创建新表,请按照下列步骤操作:打开 phpMyAdmin 并选择数据库。单击目标表,然后导航到“导入”选项卡。浏览并选择要导入的 CSV 文件。配置导入设置如下:格式: CSV ...
    编程 发布于2024-11-08
  • 如何使用 PDO_ODBC 从 Access 中正确检索 UTF-8 重音字符?
    如何使用 PDO_ODBC 从 Access 中正确检索 UTF-8 重音字符?
    无法通过 PDO_ODBC 从 Access 检索 UTF-8 重音字符尝试使用 PHP ODBC(特别是通过 PDO_ODBC)从 Access 数据库检索数据时,非标准字符可能无法正确导入,并可能导致诸如在特殊字符处显示问号之类的问题。了解问题该问题源于这样一个事实:Access ODBC 驱动...
    编程 发布于2024-11-08
  • 字符串与字符串
    字符串与字符串
    细绳 小写字符串是JavaScript中的原始数据类型。 用这种类型创建的字符串不是对象,但 JavaScript 会自动用 String 对象包装它们(这称为“装箱”)。 let imAString = "hello"; console.log(typeof imAString)...
    编程 发布于2024-11-08
  • 如何在 C++ 和 Python 中右对齐输出字符串?
    如何在 C++ 和 Python 中右对齐输出字符串?
    右对齐格式化输出字符串处理文本文件时,一致地对齐数据可以增强可读性和分析能力。在 C 中,出现了一个问题:如何才能格式化右对齐的输出字符串?使用 Python 的格式化语法,解决方案很简单:line_new = '{:>12} {:>12} {:>12}...
    编程 发布于2024-11-08
  • 黑客啤酒节第二周
    黑客啤酒节第二周
    第二周,我不得不花更少的时间寻找问题。这次是 Mattermost 文档网站在深色模式下发生的错误,其中特定按钮的颜色不正确。 我知道 Docusaurus,因为我看过其他文档和基于它构建的一些课程材料网站。它在底层使用了 React,所以我很熟悉它。但这个文档网站是用 Python 编写的。虽然我...
    编程 发布于2024-11-08
  • Python 中的 Try/Except 与 If/Else:哪种方法更有效?
    Python 中的 Try/Except 与 If/Else:哪种方法更有效?
    Try/Except 与 If/Else:哪种方法更可取?在 Python 中处理异常时,开发人员经常面临困境是否测试有效性或尝试某项操作并处理任何产生的异常。本文深入探讨了每种方法的细微差别,为决策提供指导和示例。尝试/除外:拥抱例外根据 PEP 20,错误除非明确地保持沉默,否则绝不应悄无声息地...
    编程 发布于2024-11-08
  • Git 远程分支
    Git 远程分支
    本周我们必须向另一个人的存储库添加一个功能。具体来说,我们需要在用户的 $HOME 文件夹中添加一个默认配置 TOML 文件,其中包含 CLI 工具的默认参数。我已为 readMeMaker 存储库做出了贡献: https://github.com/jadorotan/readMeMaker.git...
    编程 发布于2024-11-08
  • 对于简单的操作,流总是比传统集合慢吗?
    对于简单的操作,流总是比传统集合慢吗?
    Java 8 流性能对比传统集合您最近涉足 Java 8 并进行了非正式基准测试,以将其 Stream API 与经典集合的性能进行比较。您的测试涉及过滤整数列表、提取偶数的平方根并将结果存储在 Double 列表中。然而,您质疑测试的有效性,并渴望澄清真正的性能影响。评估基准测试您的初步结果,表明...
    编程 发布于2024-11-08
  • 语言 API,允许您添加您的母语。
    语言 API,允许您添加您的母语。
    早在 2016 年 4 月,我就有了为一个我非常喜欢的部落“Igede Language”创建一个字典项目的想法,我决定将其称为“Igede Dictionary”,尽管我不是“ t 是母语人士。 这让我撰写并翻译了 5,000 多个单词,从 Igede 语言翻译成英语。毫无疑问,这是我曾经研究过...
    编程 发布于2024-11-08
  • 使用 Playwright、TypeScript 和 JavaScript 进行自动化
    使用 Playwright、TypeScript 和 JavaScript 进行自动化
    剧作家与 TypeScript | JavaScript 安装 Playwright 是 Microsoft 与 Puppeteer 团队合作推出的基于 Web 的现代 API 自动化工具,Puppeteer 是一个 JavaScript 库,它提供高级 API 来通过 DevTools 协议或 W...
    编程 发布于2024-11-08
  • 为什么使用 Z-Index 时我的伪元素出现在标题元素上方?
    为什么使用 Z-Index 时我的伪元素出现在标题元素上方?
    Z-Index 和伪元素:案例研究在 CSS 中,z-index 属性指定元素的堆叠顺序页面,确定哪些元素出现在其他元素“前面”或“后面”。然而,当涉及到伪元素时,例如 ::before 或 ::after,它们与 z-index 的交互有时可能不那么简单。考虑一个场景,我们使用::before 伪...
    编程 发布于2024-11-08
  • 如何在剥离标签之前删除顽固的 HTML 特殊字符?
    如何在剥离标签之前删除顽固的 HTML 特殊字符?
    去除顽固的 HTML 特殊字符strip_tags 函数虽然擅长删除 HTML 标签,但无法处理讨厌的 HTML 特殊字符,例如用于不间断空格或 © 用于版权符号。这可能是创建干净 RSS 源的绊脚石。要解决此问题,请考虑使用以下策略之一:HTML 实体解码:在字符串经过 strip_tags 之前...
    编程 发布于2024-11-08
  • 如何在 Go 中解密 AES ECB 模式加密?
    如何在 Go 中解密 AES ECB 模式加密?
    Go 中的 AES ECB 加密AES ECB 模式加密,其中每个明文块都独立加密,是一种简单但可能不安全的加密方法。在Go中,可以使用以下代码执行AES ECB解密:package main import ( "crypto/aes" "fmt&quo...
    编程 发布于2024-11-08

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3