AI가 우리가 일하고 기술과 상호 작용하는 방식을 지속적으로 형성함에 따라 많은 기업은 지능형 애플리케이션 내에서 자체 데이터를 활용할 수 있는 방법을 찾고 있습니다. ChatGPT 또는 Azure OpenAI와 같은 도구를 사용해 본 적이 있다면 생성 AI가 어떻게 프로세스를 개선하고 사용자 경험을 향상시킬 수 있는지 이미 잘 알고 계실 것입니다. 그러나 진정으로 맞춤화되고 관련성이 높은 응답을 위해서는 애플리케이션에 독점 데이터가 통합되어야 합니다.
여기서 RAG(검색 증강 생성)가 등장하여 데이터 검색과 AI 기반 응답을 통합하는 구조화된 접근 방식을 제공합니다. LlamaIndex와 같은 프레임워크를 사용하면 이 기능을 솔루션에 쉽게 구축하여 비즈니스 데이터의 잠재력을 최대한 활용할 수 있습니다.
앱을 빠르게 실행하고 탐색하고 싶으신가요? 여기를 클릭하세요.
검색 증강 생성(RAG)은 관련 정보에 액세스하고 자신의 데이터를 통합하기 위한 검색 구성 요소를 포함하여 AI 텍스트 생성을 향상시키는 신경망 프레임워크입니다. 이는 두 가지 주요 부분으로 구성됩니다:
검색자는 관련 문서를 찾고 생성자는 이를 사용하여 보다 정확하고 유익한 응답을 생성합니다. 이 조합을 통해 RAG 모델은 외부 지식을 효과적으로 활용하여 생성된 텍스트의 품질과 관련성을 향상시킬 수 있습니다.
LlamaIndex를 사용하여 RAG 시스템을 구현하려면 다음 일반 단계를 따르세요.
실용적인 예를 위해 Azure OpenAI를 사용하여 완전한 RAG 구현을 보여주기 위한 샘플 애플리케이션을 제공했습니다.
이제 LlamaIndex.ts(LlamaIndex의 TypeScipt 구현) 및 Azure OpenAI를 사용하여 RAG 애플리케이션을 구축하고 Azure Container Apps에 서버리스 웹 앱으로 배포하는 데 중점을 둘 것입니다.
GitHub에서 시작하기 프로젝트를 찾을 수 있습니다. 필요할 때 자유롭게 편집할 수 있도록 이 템플릿을 포크하는 것이 좋습니다.
시작하기 프로젝트 애플리케이션은 다음 아키텍처를 기반으로 구축되었습니다.
어떤 리소스가 배포되는지에 대한 자세한 내용은 모든 샘플에서 사용할 수 있는 infra 폴더를 확인하세요.
샘플 애플리케이션에는 두 가지 워크플로에 대한 논리가 포함되어 있습니다.
데이터 수집: 데이터를 가져오고 벡터화하며 검색 색인이 생성됩니다. PDF나 Word 파일과 같은 파일을 더 추가하려면 여기에서 파일을 추가해야 합니다.
npm run generate
프롬프트 요청 처리: 앱은 사용자 프롬프트를 수신하여 Azure OpenAI로 보내고, 벡터 인덱스를 검색기로 사용하여 이러한 프롬프트를 보강합니다.
샘플을 실행하기 전에 필요한 Azure 리소스를 프로비저닝했는지 확인하세요.
GitHub Codespace에서 GitHub 템플릿을 실행하려면
를 클릭하세요.
Codespaces 인스턴스의 터미널에서 Azure 계정에 로그인합니다.
azd auth login
단일 명령을 사용하여 Azure에 샘플 애플리케이션을 프로비전, 패키징 및 배포합니다.
azd up
애플리케이션을 로컬에서 실행하고 사용해 보려면 npm 종속 항목을 설치하고 앱을 실행하세요.
npm install npm run dev
앱은 Codespaces 인스턴스의 포트 3000 또는 브라우저의 http://localhost:3000에서 실행됩니다.
이 가이드에서는 Microsoft Azure에 배포된 LlamaIndex.ts 및 Azure OpenAI를 사용하여 서버리스 RAG(Retrieval-Augmented Generation) 애플리케이션을 구축하는 방법을 보여주었습니다. 이 가이드를 따르면 Azure의 인프라와 LlamaIndex의 기능을 활용하여 데이터를 기반으로 상황에 맞게 풍부한 응답을 제공하는 강력한 AI 애플리케이션을 만들 수 있습니다.
이 시작 애플리케이션을 통해 여러분이 무엇을 구축할지 기대됩니다. 최신 업데이트와 기능을 받으려면 자유롭게 포크하고 GitHub 저장소에 좋아요를 누르세요.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3