A medida que la IA continúa dando forma a la forma en que trabajamos e interactuamos con la tecnología, muchas empresas buscan formas de aprovechar sus propios datos dentro de aplicaciones inteligentes. Si ha utilizado herramientas como ChatGPT o Azure OpenAI, ya está familiarizado con cómo la IA generativa puede mejorar los procesos y mejorar las experiencias de los usuarios. Sin embargo, para obtener respuestas verdaderamente personalizadas y relevantes, sus aplicaciones deben incorporar sus datos de propiedad exclusiva.
Aquí es donde entra en juego la generación aumentada de recuperación (RAG), que proporciona un enfoque estructurado para integrar la recuperación de datos con respuestas impulsadas por IA. Con marcos como LlamaIndex, puede incorporar fácilmente esta capacidad a sus soluciones, liberando todo el potencial de sus datos comerciales.
¿Quieres ejecutar y explorar rápidamente la aplicación? Haga clic aquí.
Retrieval-Augmented Generation (RAG) es un marco de red neuronal que mejora la generación de texto de IA al incluir un componente de recuperación para acceder a información relevante e integrar sus propios datos. Consta de dos partes principales:
El recuperador encuentra documentos relevantes y el generador los utiliza para crear respuestas más precisas e informativas. Esta combinación permite que el modelo RAG aproveche el conocimiento externo de manera efectiva, mejorando la calidad y relevancia del texto generado.
Para implementar un sistema RAG usando LlamaIndex, sigue estos pasos generales:
Como ejemplo práctico, proporcionamos una aplicación de muestra para demostrar una implementación RAG completa utilizando Azure OpenAI.
Ahora nos centraremos en crear una aplicación RAG utilizando LlamaIndex.ts (la implementación TypeScipt de LlamaIndex) y Azure OpenAI, y la implementaremos como aplicaciones web sin servidor en Azure Container Apps.
Encontrarás el proyecto de introducción en GitHub. Te recomendamos bifurcar esta plantilla para que puedas editarla libremente cuando sea necesario:
La aplicación del proyecto de introducción se basa en la siguiente arquitectura:
Para obtener más detalles sobre qué recursos se implementan, consulte la carpeta infra disponible en todos nuestros ejemplos.
La aplicación de muestra contiene lógica para dos flujos de trabajo:
Ingestión de datos: los datos se recuperan, se vectorizan y se crean índices de búsqueda. Si desea agregar más archivos como PDF o Word, aquí es donde debe agregarlos.
npm run generate
Atendiendo solicitudes de aviso: la aplicación recibe avisos del usuario, los envía a Azure OpenAI y aumenta estos avisos utilizando el índice vectorial como recuperador.
Antes de ejecutar la muestra, asegúrese de haber aprovisionado los recursos de Azure necesarios.
Para ejecutar la plantilla de GitHub en GitHub Codespace, simplemente haga clic en
En tu instancia de Codespaces, inicia sesión en tu cuenta de Azure, desde tu terminal:
azd auth login
Aprovisione, empaquete e implemente la aplicación de muestra en Azure mediante un solo comando:
azd up
Para ejecutar y probar la aplicación localmente, instale las dependencias de npm y ejecute la aplicación:
npm install npm run dev
La aplicación se ejecutará en el puerto 3000 de tu instancia de Codespaces o en http://localhost:3000 de tu navegador.
Esta guía demostró cómo crear una aplicación RAG (generación aumentada de recuperación) sin servidor utilizando LlamaIndex.ts y Azure OpenAI, implementada en Microsoft Azure. Si sigue esta guía, podrá aprovechar la infraestructura de Azure y las capacidades de LlamaIndex para crear potentes aplicaciones de IA que brinden respuestas contextualmente enriquecidas basadas en sus datos.
Estamos entusiasmados de ver lo que creas con esta aplicación de introducción. No dudes en bifurcarlo y darle Me gusta al repositorio de GitHub para recibir las últimas actualizaciones y funciones.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3