LlamaIndex.ts और Azure OpenAI के साथ एक RAG ऐप बनाना: आरंभ करना!

मुखपृष्ठ > प्रोग्रामिंग > LlamaIndex.ts और Azure OpenAI के साथ एक RAG ऐप बनाना: आरंभ करना!

LlamaIndex.ts और Azure OpenAI के साथ एक RAG ऐप बनाना: आरंभ करना!

2024-11-08 को प्रकाशित

ब्राउज़ करें:535

चूंकि एआई हमारे काम करने के तरीके और प्रौद्योगिकी के साथ बातचीत को आकार दे रहा है, कई व्यवसाय बुद्धिमान अनुप्रयोगों के भीतर अपने स्वयं के डेटा का लाभ उठाने के तरीकों की तलाश कर रहे हैं। यदि आपने ChatGPT या Azure OpenAI जैसे टूल का उपयोग किया है, तो आप पहले से ही परिचित हैं कि जेनेरिक AI प्रक्रियाओं को कैसे बेहतर बना सकता है और उपयोगकर्ता के अनुभवों को बढ़ा सकता है। हालाँकि, वास्तव में अनुकूलित और प्रासंगिक प्रतिक्रियाओं के लिए, आपके एप्लिकेशन को आपके स्वामित्व डेटा को शामिल करने की आवश्यकता है।

यह वह जगह है जहां पुनर्प्राप्ति-संवर्धित पीढ़ी (आरएजी) आती है, जो एआई-संचालित प्रतिक्रियाओं के साथ डेटा पुनर्प्राप्ति को एकीकृत करने के लिए एक संरचित दृष्टिकोण प्रदान करती है। LlamaIndex जैसे फ़्रेमवर्क के साथ, आप आसानी से अपने समाधानों में इस क्षमता का निर्माण कर सकते हैं, जिससे आपके व्यावसायिक डेटा की पूरी क्षमता का पता चल जाएगा।

Building a RAG app with LlamaIndex.ts and Azure OpenAI: Getting started!

क्या आप ऐप को तुरंत चलाना और एक्सप्लोर करना चाहते हैं? यहाँ क्लिक करें।

RAG - पुनर्प्राप्ति-संवर्धित पीढ़ी क्या है?

रिट्रीवल-ऑगमेंटेड जेनरेशन (आरएजी) एक न्यूरल नेटवर्क फ्रेमवर्क है जो प्रासंगिक जानकारी तक पहुंचने और अपने स्वयं के डेटा को एकीकृत करने के लिए एक पुनर्प्राप्ति घटक को शामिल करके एआई टेक्स्ट जेनरेशन को बढ़ाता है। इसमें दो मुख्य भाग होते हैं:

रिट्रीवर: एक सघन रिट्रीवर मॉडल (उदाहरण के लिए, बीईआरटी पर आधारित) जो किसी दिए गए प्रश्न से संबंधित प्रासंगिक अंश या जानकारी खोजने के लिए दस्तावेजों के एक बड़े संग्रह की खोज करता है।
जेनरेटर: एक अनुक्रम-से-अनुक्रम मॉडल (उदाहरण के लिए, BART या T5 पर आधारित) जो क्वेरी और पुनर्प्राप्त पाठ को इनपुट के रूप में लेता है और एक सुसंगत, प्रासंगिक रूप से समृद्ध प्रतिक्रिया उत्पन्न करता है।

रिट्रीवर प्रासंगिक दस्तावेज़ ढूंढता है, और जनरेटर उनका उपयोग अधिक सटीक और सूचनात्मक प्रतिक्रियाएँ बनाने के लिए करता है। यह संयोजन आरएजी मॉडल को बाहरी ज्ञान का प्रभावी ढंग से लाभ उठाने, उत्पन्न पाठ की गुणवत्ता और प्रासंगिकता में सुधार करने की अनुमति देता है।

LlamaIndex RAG को कैसे कार्यान्वित करता है?

LlamaIndex का उपयोग करके RAG प्रणाली लागू करने के लिए, इन सामान्य चरणों का पालन करें:

डेटा अंतर्ग्रहण:

SimpleDirectoryReader जैसे दस्तावेज़ लोडर का उपयोग करके अपने दस्तावेज़ों को LlamaIndex.ts में लोड करें, जो PDF, API, या SQL डेटाबेस जैसे विभिन्न स्रोतों से डेटा आयात करने में मदद करता है।
सेंटेंसस्प्लिटर का उपयोग करके बड़े दस्तावेज़ों को छोटे, प्रबंधनीय टुकड़ों में तोड़ें।

सूचकांक निर्माण:

वेक्टरस्टोरइंडेक्स का उपयोग करके इन दस्तावेज़ खंडों का एक वेक्टर इंडेक्स बनाएं, जो एम्बेडिंग के आधार पर कुशल समानता खोज की अनुमति देता है।
वैकल्पिक रूप से, जटिल डेटासेट के लिए, पदानुक्रमित रूप से संरचित डेटा को प्रबंधित करने और उपयोगकर्ता प्रश्नों के आधार पर प्रासंगिक अनुभागों को पुनर्प्राप्त करने के लिए पुनरावर्ती पुनर्प्राप्ति तकनीकों का उपयोग करें।

क्वेरी इंजन सेटअप:

समानताTopK जैसे मापदंडों के साथ asQueryEngine का उपयोग करके वेक्टर इंडेक्स को एक क्वेरी इंजन में परिवर्तित करें ताकि यह परिभाषित किया जा सके कि कितने शीर्ष दस्तावेज़ पुनर्प्राप्त किए जाने चाहिए।
अधिक उन्नत सेटअप के लिए, एक मल्टी-एजेंट सिस्टम बनाएं जहां प्रत्येक एजेंट विशिष्ट दस्तावेज़ों के लिए ज़िम्मेदार है, और एक शीर्ष-स्तरीय एजेंट समग्र पुनर्प्राप्ति प्रक्रिया का समन्वय करता है।

पुनर्प्राप्ति और सृजन:

एक उद्देश्य फ़ंक्शन को परिभाषित करके आरएजी पाइपलाइन को कार्यान्वित करें जो उपयोगकर्ता प्रश्नों के आधार पर प्रासंगिक दस्तावेज़ खंड पुनर्प्राप्त करता है।
CohereRerank जैसे टूल का उपयोग करके पुनर्प्राप्त दस्तावेज़ों को फिर से रैंक करने जैसे वैकल्पिक पोस्ट-प्रोसेसिंग चरणों के साथ, वास्तविक पुनर्प्राप्ति और क्वेरी प्रोसेसिंग करने के लिए RetrieverQueryEngine का उपयोग करें।

एक व्यावहारिक उदाहरण के लिए, हमने Azure OpenAI का उपयोग करके संपूर्ण RAG कार्यान्वयन को प्रदर्शित करने के लिए एक नमूना एप्लिकेशन प्रदान किया है।

व्यावहारिक आरएजी नमूना अनुप्रयोग

अब हम LlamaIndex.ts (LlamaIndex का टाइपस्क्रिप्ट कार्यान्वयन) और Azure OpenAI का उपयोग करके एक RAG एप्लिकेशन बनाने पर ध्यान केंद्रित करेंगे, और इसे Azure कंटेनर ऐप्स पर सर्वर रहित वेब ऐप्स के रूप में तैनात करेंगे।

नमूना चलाने के लिए आवश्यकताएँ

Azure डेवलपर CLI (azd): बैकएंड, फ्रंटएंड और डेटाबेस सहित आपके संपूर्ण ऐप को आसानी से तैनात करने के लिए एक कमांड-लाइन टूल।
Azure खाता: एप्लिकेशन को तैनात करने के लिए आपको एक Azure खाते की आवश्यकता होगी। आरंभ करने के लिए कुछ क्रेडिट के साथ एक निःशुल्क Azure खाता प्राप्त करें।

आपको आरंभिक प्रोजेक्ट GitHub पर मिलेगा। हम आपको इस टेम्पलेट को फोर्क करने की सलाह देते हैं ताकि जरूरत पड़ने पर आप इसे स्वतंत्र रूप से संपादित कर सकें:

Building a RAG app with LlamaIndex.ts and Azure OpenAI: Getting started!

उच्च स्तरीय वास्तुकला

प्रारंभिक प्रोजेक्ट एप्लिकेशन निम्नलिखित आर्किटेक्चर के आधार पर बनाया गया है:

Azure OpenAI: AI प्रदाता जो उपयोगकर्ता के प्रश्नों को संसाधित करता है।
LlamaIndex.ts: वह ढांचा जो सामग्री (पीडीएफ) को ग्रहण करने, बदलने और वेक्टराइज़ करने और एक खोज सूचकांक बनाने में मदद करता है।
Azure कंटेनर ऐप्स: कंटेनर वातावरण जहां सर्वर रहित एप्लिकेशन होस्ट किया जाता है।
Azure प्रबंधित पहचान: शीर्ष स्तर की सुरक्षा सुनिश्चित करता है और क्रेडेंशियल और एपीआई कुंजियों को संभालने की आवश्यकता को समाप्त करता है।

Building a RAG app with LlamaIndex.ts and Azure OpenAI: Getting started!

कौन से संसाधन तैनात किए गए हैं, इसके बारे में अधिक जानकारी के लिए, हमारे सभी नमूनों में उपलब्ध इन्फ्रा फ़ोल्डर की जांच करें।

उदाहरण उपयोगकर्ता वर्कफ़्लोज़

नमूना एप्लिकेशन में दो वर्कफ़्लो के लिए तर्क शामिल हैं:

डेटा अंतर्ग्रहण: डेटा प्राप्त किया जाता है, वेक्टरकृत किया जाता है, और खोज अनुक्रमणिका बनाई जाती है। यदि आप पीडीएफ़ या वर्ड फ़ाइलों जैसी और फ़ाइलें जोड़ना चाहते हैं, तो आपको उन्हें यहीं जोड़ना चाहिए।
```
  npm run generate
```
प्रॉम्प्ट अनुरोध प्रस्तुत करना: ऐप उपयोगकर्ता के संकेत प्राप्त करता है, उन्हें Azure OpenAI पर भेजता है, और एक रिट्रीवर के रूप में वेक्टर इंडेक्स का उपयोग करके इन संकेतों को बढ़ाता है।

नमूना चलाना

नमूना चलाने से पहले, सुनिश्चित करें कि आपने आवश्यक Azure संसाधनों का प्रावधान किया है।

GitHub कोडस्पेस में GitHub टेम्पलेट चलाने के लिए, बस
पर क्लिक करें Building a RAG app with LlamaIndex.ts and Azure OpenAI: Getting started!

अपने कोडस्पेस उदाहरण में, अपने टर्मिनल से अपने Azure खाते में साइन इन करें:

azd auth login

एकल आदेश का उपयोग करके नमूना एप्लिकेशन को Azure में प्रावधान, पैकेज और तैनात करें:

azd up

एप्लिकेशन को स्थानीय रूप से चलाने और आज़माने के लिए, एनपीएम निर्भरता स्थापित करें और ऐप चलाएं:

npm install
npm run dev

ऐप आपके कोडस्पेस इंस्टेंस में पोर्ट 3000 पर या आपके ब्राउज़र में http://localhost:3000 पर चलेगा।

निष्कर्ष

इस गाइड ने दिखाया कि Microsoft Azure पर तैनात LlamaIndex.ts और Azure OpenAI का उपयोग करके सर्वर रहित RAG (रिट्रीवल-ऑगमेंटेड जेनरेशन) एप्लिकेशन कैसे बनाया जाए। इस गाइड का पालन करके, आप शक्तिशाली AI एप्लिकेशन बनाने के लिए Azure के बुनियादी ढांचे और LlamaIndex की क्षमताओं का लाभ उठा सकते हैं जो आपके डेटा के आधार पर प्रासंगिक रूप से समृद्ध प्रतिक्रियाएं प्रदान करते हैं।

हम यह देखने के लिए उत्साहित हैं कि आप इस आरंभिक एप्लिकेशन के साथ क्या बनाते हैं। नवीनतम अपडेट और सुविधाएँ प्राप्त करने के लिए बेझिझक इसे फोर्क करें और GitHub रिपॉजिटरी को लाइक करें।

विज्ञप्ति वक्तव्य इस लेख को पुन: प्रस्तुत किया गया है: https://dev.to/azure/building-a-rag-app-with-llamaindexts-and-azure-openai-getted-3pgb?1 यदि कोई उल्लंघन है, तो कृपया इसे हटाने के लिए [email protected] पर संपर्क करें।

नवीनतम ट्यूटोरियल अधिक>

ऑब्जेक्ट-फिट: कवर IE और एज में विफल रहता है, कैसे ठीक करें?
] सीएसएस में लगातार छवि ऊंचाई बनाए रखने के लिए ब्राउज़रों में मूल रूप से काम करता है। हालांकि, IE और एज में, एक अजीबोगरीब मुद्दा उठता है। ब्राउज़र को ...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया
PHP सरणी कुंजी-मूल्य विसंगतियाँ: 07 और 08 के जिज्ञासु मामले को समझना
] PHP में, एक असामान्य मुद्दा तब उत्पन्न होता है जब कुंजियों में 07 या 08 जैसे संख्यात्मक मान होते हैं। Print_r ($ महीने) चलाना अप्रत्याशित परिणाम देत...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया
गतिशील रूप से आकार के मूल तत्व के भीतर एक तत्व की स्क्रॉलिंग रेंज को कैसे सीमित करें?
] इस तरह के एक परिदृश्य में गतिशील रूप से आकार के मूल तत्व के भीतर एक तत्व की स्क्रॉलिंग रेंज को सीमित करना शामिल है। हालाँकि, मानचित्र की स्क्रॉलिंग ...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया
Android PHP सर्वर पर पोस्ट डेटा कैसे भेजता है?
] सर्वर-साइड संचार से निपटने के दौरान यह एक सामान्य परिदृश्य है। Apache httpclient (defforated) httpclient httpclient = new defaulthttpclient (); ...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया
कैसे एक जावास्क्रिप्ट ऑब्जेक्ट की कुंजी को वर्णानुक्रम में सॉर्ट करने के लिए?
] यह निम्नलिखित चरणों का उपयोग करके प्राप्त किया जा सकता है: object की कुंजियों को एक सरणी में const unordered = { 'b': 'foo', 'c': 'bar', ...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया
मेरी रैखिक ढाल पृष्ठभूमि में धारियां क्यों हैं, और मैं उन्हें कैसे ठीक कर सकता हूं?
] इन भद्दे कलाकृतियों को एक जटिल पृष्ठभूमि प्रसार घटना के लिए जिम्मेदार ठहराया जा सकता है। इसके बाद, रैखिक-ग्रेडिएंट इस पूरी ऊंचाई पर फैलता है, दोहराए...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया
$Ubuntu/linux पर mysql-python स्थापित करते समय \ "mysql_config को कैसे नहीं मिला \" त्रुटि नहीं मिली?$
Ubuntu/linux पर mysql-python स्थापित करते समय \ "mysql_config को कैसे नहीं मिला \" त्रुटि नहीं मिली?
] यह त्रुटि एक लापता MySQL विकास पुस्तकालय के कारण उत्पन्न होती है। निम्नलिखित कमांड का उपयोग करके पायथन-mysqldb स्थापित करें: sudo apt-get python-...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया
पायथन के अनुरोधों और नकली उपयोगकर्ता एजेंटों के साथ वेबसाइट ब्लॉक को कैसे बायपास करें?
] ऐसा इसलिए है क्योंकि वेबसाइटें एंटी-बॉट उपायों को लागू कर सकती हैं जो वास्तविक ब्राउज़रों और स्वचालित स्क्रिप्ट के बीच अंतर करते हैं। इन ब्लॉकों को ...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया
जावास्क्रिप्ट ऑब्जेक्ट्स में गतिशील रूप से चाबियां कैसे सेट करें?
] सही दृष्टिकोण वर्ग कोष्ठक को नियोजित करता है: jsobj ['कुंजी' i] = 'उदाहरण' 1; जावास्क्रिप्ट में, सरणियाँ एक विशेष प्रकार का ऑ...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया
$क्यों isn \ 't मेरी css पृष्ठभूमि छवि दिखाई दे रही है?$
क्यों isn \ 't मेरी css पृष्ठभूमि छवि दिखाई दे रही है?
] छवि और स्टाइल शीट एक ही निर्देशिका में निवास कर रही है, फिर भी पृष्ठभूमि एक खाली सफेद कैनवास बनी हुई है। छवि को संलग्न करने वाले उद्धरण फ़ाइल नाम: ...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया
कैसे regex का उपयोग करके PHP में कुशलता से कोष्ठक के भीतर पाठ निकालें
] एक दृष्टिकोण PHP के स्ट्रिंग हेरफेर कार्यों का उपयोग करने के लिए है, जैसा कि नीचे प्रदर्शित किया गया है: $ फुलस्ट्रिंग = "इस (पाठ) को छोड़क...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया
मैं पूरे HTML दस्तावेज़ में एक विशिष्ट तत्व प्रकार के पहले उदाहरण को कैसे स्टाइल कर सकता हूं?
] : प्रथम-प्रकार के छद्म-क्लास अपने मूल तत्व के भीतर एक प्रकार के पहले तत्व से मेल खाने तक सीमित है। एक प्रकार का पहला तत्व, एक जावास्क्रिप्ट सम...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया
पायथन पढ़ें CSV फ़ाइल Unicodedecodeerror अल्टीमेट सॉल्यूशन
डिकोड बाइट्स स्थिति 2-3 में: truncated \ uxxxxxxxxx escape यह त्रुटि तब होती है जब CSV फ़ाइल के पथ में विशेष वर्ण होते हैं या यूनिकोड होता है कि पा...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया
गो लैंग्वेज कचरा संग्रह में कटा हुआ मेमोरी से कैसे निपटें?
] स्लाइस के साथ काम करते समय, संभावित मेमोरी लीक से बचने के लिए कचरा संग्रह व्यवहार को समझना महत्वपूर्ण होता है। r: = (*q) [0] *क्यू = (*क्यू)...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया
MySQLI पर स्विच करने के बाद MySQL डेटाबेस से कनेक्ट करने के लिए CodeIgniter के कारण
] यह त्रुटि गलत PHP कॉन्फ़िगरेशन से उत्पन्न हो सकती है। समस्या को डिबग करने के लिए, यह फ़ाइल के अंत में निम्न कोड जोड़ने के लिए अनुशंसित है ।/config...

प्रोग्रामिंग 2025-04-15 को पोस्ट किया गया