Поскольку ИИ продолжает формировать то, как мы работаем и взаимодействуем с технологиями, многие компании ищут способы использовать свои собственные данные в интеллектуальных приложениях. Если вы использовали такие инструменты, как ChatGPT или Azure OpenAI, вы уже знакомы с тем, как генеративный ИИ может улучшить процессы и улучшить взаимодействие с пользователем. Однако для получения по-настоящему персонализированных и релевантных ответов ваши приложения должны включать ваши собственные данные.
Именно здесь на помощь приходит технология дополненной генерации данных (RAG), обеспечивающая структурированный подход к интеграции поиска данных с ответами на основе искусственного интеллекта. С помощью таких платформ, как LlamaIndex, вы можете легко встроить эту возможность в свои решения, раскрывая весь потенциал ваших бизнес-данных.
Хотите быстро запустить и изучить приложение? Кликните сюда.
Поисковая дополненная генерация (RAG) — это платформа нейронной сети, которая расширяет возможности генерации текста с помощью искусственного интеллекта, включая компонент поиска для доступа к соответствующей информации и интеграции ваших собственных данных. Он состоит из двух основных частей:
Поиск находит соответствующие документы, а генератор использует их для создания более точных и информативных ответов. Эта комбинация позволяет модели RAG эффективно использовать внешние знания, улучшая качество и релевантность создаваемого текста.
Чтобы реализовать систему RAG с использованием LlamaIndex, выполните следующие общие шаги:
В качестве практического примера мы предоставили образец приложения, демонстрирующий полную реализацию RAG с использованием Azure OpenAI.
Теперь мы сосредоточимся на создании приложения RAG с использованием LlamaIndex.ts (реализация LlamaIndex в TypeScipt) и Azure OpenAI и его развертывании в качестве бессерверных веб-приложений в приложениях-контейнерах Azure.
На GitHub вы найдете проект для начала работы. Мы рекомендуем вам создать форк этого шаблона, чтобы вы могли свободно редактировать его при необходимости:
Приложение проекта «Начало работы» построено на основе следующей архитектуры:
Для получения более подробной информации о том, какие ресурсы развернуты, проверьте папку infra, доступную во всех наших примерах.
Пример приложения содержит логику для двух рабочих процессов:
Прием данных: данные извлекаются, векторизуются и создаются индексы поиска. Если вы хотите добавить больше файлов, например PDF-файлов или файлов Word, их следует добавить сюда.
npm run generate
Обслуживание запросов на подсказки: приложение получает подсказки пользователя, отправляет их в Azure OpenAI и дополняет эти подсказки, используя векторный индекс в качестве средства извлечения.
Перед запуском примера убедитесь, что вы предоставили необходимые ресурсы Azure.
Чтобы запустить шаблон GitHub в GitHub Codespace, просто нажмите
В своем экземпляре Codespaces войдите в свою учетную запись Azure со своего терминала:
azd auth login
Предоставьте, упакуйте и разверните пример приложения в Azure с помощью одной команды:
azd up
Чтобы запустить и опробовать приложение локально, установите зависимости npm и запустите приложение:
npm install npm run dev
Приложение будет работать на порту 3000 в вашем экземпляре Codespaces или по адресу http://localhost:3000 в вашем браузере.
В этом руководстве показано, как создать бессерверное приложение RAG (дополненная генерация данных) с использованием LlamaIndex.ts и Azure OpenAI, развернутого в Microsoft Azure. Следуя этому руководству, вы сможете использовать инфраструктуру Azure и возможности LlamaIndex для создания мощных приложений искусственного интеллекта, которые предоставляют контекстно-обогащенные ответы на основе ваших данных.
Мы рады видеть, что вы создадите с помощью этого приложения для начала работы. Не стесняйтесь создать его форк и поставить лайк репозиторию GitHub, чтобы получать последние обновления и функции.
Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3