"यदि कोई कर्मचारी अपना काम अच्छी तरह से करना चाहता है, तो उसे पहले अपने औजारों को तेज करना होगा।" - कन्फ्यूशियस, "द एनालेक्ट्स ऑफ कन्फ्यूशियस। लू लिंगगोंग"
मुखपृष्ठ >  > 5 सर्वश्रेष्ठ ओपन-सोर्स एआई इमेज जेनरेटर

5 सर्वश्रेष्ठ ओपन-सोर्स एआई इमेज जेनरेटर

2024-09-02 को प्रकाशित
ब्राउज़ करें:356

इंटरनेट पर दर्जनों मुफ़्त और ओपन-सोर्स एआई टेक्स्ट-टू-इमेज जेनरेटर उपलब्ध हैं जो विशिष्ट प्रकार की छवियों में विशेषज्ञ हैं। इसलिए, हमने ढेर की जांच की है और सबसे अच्छा ओपन-सोर्स एआई टेक्स्ट-टू-इमेज जेनरेटर पाया है जिसे आप अभी आज़मा सकते हैं।

1 क्रेयॉन

The 5 Best Open-Source AI Image Generators

क्रेयॉन सबसे आसानी से सुलभ ओपन-सोर्स एआई छवि जनरेटर में से एक है। यह DALL-E Mini पर आधारित है, और जब आप Github रिपॉजिटरी को क्लोन कर सकते हैं और मॉडल को अपने कंप्यूटर पर स्थानीय रूप से इंस्टॉल कर सकते हैं, तो ऐसा लगता है कि Craiyon ने अपनी वेबसाइट के पक्ष में इस दृष्टिकोण को छोड़ दिया है।

आधिकारिक जीथब रिपॉजिटरी को जून 2022 से अपडेट नहीं किया गया है, लेकिन नवीनतम मॉडल अभी भी आधिकारिक क्रेयॉन साइट पर मुफ्त में उपलब्ध है। कोई एंड्रॉइड या आईओएस ऐप भी नहीं हैं।

कार्यक्षमता के संदर्भ में, आपको वे सभी सामान्य विकल्प दिखाई देंगे जिनकी आप AI छवि जनरेटर से अपेक्षा करते हैं। एक बार जब आप अपना संकेत दर्ज करते हैं और एक छवि प्राप्त करते हैं, तो आप उच्च-रिज़ॉल्यूशन प्रतिलिपि प्राप्त करने के लिए अपस्केल सुविधा का उपयोग कर सकते हैं। चुनने के लिए तीन शैलियाँ हैं: कला, फोटो और ड्राइंग। यदि आप चाहते हैं कि मॉडल तय हो तो आप "कोई नहीं" विकल्प भी चुन सकते हैं।

The 5 Best Open-Source AI Image Generators

इसके अतिरिक्त, "विशेषज्ञ मोड" आपको नकारात्मक शब्द शामिल करने देता है, जो मॉडल को विशिष्ट वस्तुओं से बचने के लिए कहता है। इसमें एक त्वरित पूर्वानुमान सुविधा भी है, जो उपयोगकर्ताओं को यथासंभव सर्वोत्तम, सबसे विस्तृत संकेत लिखने में मदद करने के लिए ChatGPT का उपयोग करती है। अंत में, एआई-पावर्ड रिमूव बैकग्राउंड फीचर्स आपको छवियों से बैकग्राउंड क्रॉप करने में समय और प्रयास बचाने में मदद कर सकते हैं।

और यही वह सब कुछ है जो क्रेयॉन करता है। यह सबसे परिष्कृत एआई छवि निर्माण मॉडल नहीं है, लेकिन यदि आप कुछ विस्तृत या यथार्थवादी नहीं चाहते हैं तो यह एक बुनियादी मॉडल के रूप में अच्छा काम करता है।

मॉडल उपयोग करने के लिए मुफ़्त है, लेकिन मुफ़्त उपयोगकर्ता एक मिनट के भीतर एक समय में नौ मुफ़्त छवियों तक सीमित हैं। आप कोई विज्ञापन या वॉटरमार्क नहीं, तेज़ पीढ़ी और अपनी जेनरेट की गई छवियों को निजी रखने का विकल्प पाने के लिए उनके समर्थक या पेशेवर स्तरों की सदस्यता ले सकते हैं (कीमत क्रमशः $5 और $20 प्रति माह है, और सालाना बिल दिया जाता है)। एक कस्टम सदस्यता स्तर कस्टम मॉडल, एकीकरण, समर्पित समर्थन और निजी सर्वर की भी अनुमति देता है।

2 स्टेबल डिफ्यूजन 1.5

स्टेबल डिफ्यूजन शायद सबसे लोकप्रिय ओपन-सोर्स टेक्स्ट-टू-इमेज जेनरेशन मॉडल में से एक है। यह नीचे उल्लिखित तीन छवि जनरेटर सहित अन्य मॉडलों को भी शक्ति प्रदान करता है। इसे 2022 में जारी किया गया था और तब से इसके कई कार्यान्वयन हुए हैं।

The 5 Best Open-Source AI Image Generators

मैं आपको मॉडल कैसे काम करता है (जिसके लिए आप उनके आधिकारिक जीथब रिपॉजिटरी की जांच कर सकते हैं) के अत्यधिक तकनीकी विवरण बताऊंगा, लेकिन मॉडल को पूरी तरह से शुरुआती लोगों के लिए भी स्थापित करना आसान है और अच्छी तरह से काम करता है जब तक आपके पास कम से कम 4GB मेमोरी वाला एक समर्पित GPU है। आप स्टेबल डिफ्यूजन को ऑनलाइन भी एक्सेस कर सकते हैं, और यदि आप मैक पर स्टेबल डिफ्यूजन चलाना चाहते हैं तो हमने आपको कवर कर लिया है।

स्थिर प्रसार के लिए उपयोग करने के लिए कई चेकपॉइंट्स (उन्हें संस्करण पर विचार करें) उपलब्ध हैं। जबकि हमने संस्करण 1.5 का परीक्षण किया, संस्करण 2.1 भी सक्रिय विकास में है और अधिक सटीक है।

The 5 Best Open-Source AI Image Generators

मॉडल को चलाना भी काफी आसान है। हमने इसे AUTOMATIC1111 स्टेबल डिफ्यूजन वेब यूजर इंटरफेस के साथ परीक्षण किया, और सभी नियंत्रण और पैरामीटर अच्छी तरह से काम करते हैं। यह LAION-5B डेटाबेस के सौजन्य से काफी NSFW-प्रूफ है जिस पर मॉडल को प्रशिक्षित किया गया है (हालाँकि यह सही नहीं है, ध्यान रखें)। जबकि पीढ़ी का समय आपके हार्डवेयर के आधार पर अलग-अलग होगा, आप बुनियादी संकेतों के साथ भी अपनी छवियों के विस्तृत और यथार्थवादी होने की उम्मीद कर सकते हैं।

3 ड्रीमशेपर

ड्रीमशेपर स्टेबल डिफ्यूजन पर आधारित एक इमेज जेनरेशन मॉडल है। इसका उद्देश्य मिडजर्नी के ओपन-सोर्स विकल्प के रूप में था और उत्पन्न छवियों में फोटोरियलिज्म पर ध्यान केंद्रित करता है, हालांकि यह कुछ बदलावों के साथ एनीमे और पेंटिंग शैलियों को भी संभाल सकता है।

मॉडल स्टेबल डिफ्यूजन की तुलना में अधिक सक्षम है, जिससे उपयोगकर्ताओं को अंतिम आउटपुट पर अधिक स्वतंत्रता मिलती है, जिसमें बिजली के सुधार से लेकर ढीले एनएसएफडब्ल्यू प्रतिबंध तक शामिल हैं। मॉडल को चलाना भी आसान है, स्थानीय पहुंच के लिए डाउनलोड करने योग्य, पूर्व-प्रशिक्षित संस्करण ऑनलाइन उपलब्ध है और सिंकिन.एआई, रैंडमसीड और मैज.स्पेस (एक बुनियादी सदस्यता की आवश्यकता है) सहित कई वेबसाइटें हैं जो आपको मॉडल चलाने की सुविधा देती हैं। जीपीयू त्वरण.

The 5 Best Open-Source AI Image Generators

जैसा कि आप शायद अब तक अनुमान लगा सकते हैं, ड्रीमशेपर द्वारा उत्पन्न छवियां स्टेबल डिफ्यूजन की तुलना में अधिक यथार्थवादी दिखती हैं। भले ही आप दोनों मॉडलों पर एक ही प्रॉम्प्ट चलाते हैं, ड्रीमशेपर मॉडल संभवतः अधिक यथार्थवादी, विस्तृत और बेहतर रोशनी वाला होगा।

यह पोर्ट्रेट या पात्रों के लिए विशेष रूप से सच है, मुझे उसी प्रॉम्प्ट की तुलना में स्टेबल डिफ्यूजन की कमी महसूस हुई। यदि आपकी छवियां बहुत यथार्थवादी हो जाती हैं, तो एआई-जनरेटेड छवि की पहचान करने के चार तरीके यहां दिए गए हैं।

मॉडल को चलाने के लिए आपको एक विशाल पीसी की भी आवश्यकता नहीं है। 4GB VRAM के साथ मेरे GTX 1650Ti ने मॉडल को पूरी तरह से चलाया। उत्पादन का समय थोड़ा अधिक था, लेकिन इसका वास्तविक उत्पादन पर कोई प्रभाव नहीं पड़ा। जैसा कि कहा गया है, आपको ड्रीमशेपर एक्सएल चलाने के लिए अधिक वीआरएएम वाले जीपीयू की आवश्यकता हो सकती है, जो स्टेबल डिफ्यूजन एक्सएल मॉडल पर आधारित है।

4 इनवोकएआई

इनवोक एआई स्टेबल डिफ्यूजन पर आधारित एक और एआई-आधारित इमेज जेनरेशन मॉडल है, जिसमें स्टेबल डिफ्यूजन एक्सएल पर आधारित एक्सएल संस्करण है। इसका अपना वेब और कमांड लाइन यूजर इंटरफेस भी है, जिसका अर्थ है कि आपको स्टेबल डिफ्यूजन वेब यूआई जैसी चीजों के साथ परेशान नहीं होना पड़ेगा।

The 5 Best Open-Source AI Image Generators

मॉडल उपयोगकर्ताओं को अनुकूलित वर्कफ़्लो के साथ उनकी बौद्धिक संपदा के आधार पर दृश्य बनाने की सुविधा देने पर केंद्रित है। कस्टम मॉडल के प्रशिक्षण और बौद्धिक संपदा के साथ काम करने के लिए InvokeAI सबसे अच्छे ओपन-सोर्स AI इमेज जेनरेशन मॉडल में से एक है।

इसकी आधिकारिक जीथब रिपॉजिटरी दो इंस्टॉलेशन विधियों को सूचीबद्ध करती है: InvokeAI के इंस्टॉलर के माध्यम से इंस्टॉल करना या यदि आप टर्मिनल और पायथन के साथ सहज हैं तो PyPI का उपयोग करना और मॉडल के साथ इंस्टॉल किए गए पैकेजों पर अधिक नियंत्रण की आवश्यकता है।

हालाँकि, अतिरिक्त नियंत्रण कुछ सीमाएँ लाता है, विशेष रूप से सख्त हार्डवेयर आवश्यकताएँ। InvokeAI कम से कम 4 जीबी मेमोरी के साथ एक समर्पित जीपीयू की सिफारिश करता है, जिसमें एक्सएल वेरिएंट को चलाने के लिए छह से आठ जीबी की सिफारिश की जाती है। वीआरएएम आवश्यकताएँ एएमडी और एनवीडिया जीपीयू दोनों पर लागू होती हैं। आपको मॉडल, उसकी निर्भरता और पायथन के लिए कम से कम 12GB रैम और 12GB मुफ्त डिस्क स्थान की भी आवश्यकता होगी।

The 5 Best Open-Source AI Image Generators

हालांकि दस्तावेज़ीकरण वीडियो मेमोरी की कमी के कारण एनवीडिया की जीटीएक्स 10 सीरीज़ और 16 सीरीज़ जीपीयू की अनुशंसा नहीं करता है, लेकिन प्रदान किया गया इंस्टॉलर ठीक से चलता है। यद्यपि आपका माइलेज अलग-अलग हो सकता है, यदि आप निचले स्तर के जीपीयू पर हैं, तो अपने संकेतों को छवियों में परिवर्तित होते देखने के लिए अधिक समय तक प्रतीक्षा करने की अपेक्षा करें। अंत में, यदि आप विंडोज़ पर हैं, तो आप केवल एनवीडिया जीपीयू का उपयोग कर सकते हैं, क्योंकि वर्तमान में एएमडी जीपीयू के लिए कोई समर्थन नहीं है।

छवि निर्माण भाग के लिए, मॉडल फोटोयथार्थवाद की तुलना में कलात्मक शैलियों की ओर अधिक झुकाव रखता है। बेशक, आप अपने डेटासेट पर मॉडल को प्रशिक्षित कर सकते हैं और इससे आप जो चाहते हैं उसके करीब छवियां उत्पन्न कर सकते हैं, भले ही इसमें फोटोरिअलिस्टिक छवियां शामिल हों, खासकर यदि आप उत्पाद डिजाइन, वास्तुकला या खुदरा स्थानों में काम कर रहे हैं। हालाँकि, ध्यान रखने योग्य एक महत्वपूर्ण बात यह है कि InvokeAI मुख्य रूप से एक छवि निर्माण इंजन है, जिसका अर्थ है कि आपको संभवतः सर्वोत्तम परिणामों के लिए अपने स्वयं के मॉडल का उपयोग करना होगा (वेब ​​​​इंटरफ़ेस में प्रदान किए गए मॉडल प्रबंधक के माध्यम से आसानी से पाया जा सकता है) डिफ़ॉल्ट के रूप में मॉडल काफी हद तक स्टेबल डिफ्यूजन के समान है।

5 ओपनजर्नी

ओपनजर्नी एक स्वतंत्र, ओपन-सोर्स एआई इमेज जेनरेशन मॉडल है जो एक बार फिर स्टेबल डिफ्यूजन पर आधारित है। यदि आप सोच रहे हैं कि मॉडल को ओपनजॉर्नी क्यों कहा जाता है, तो ऐसा इसलिए है क्योंकि इसे मिडजॉर्नी छवियों पर प्रशिक्षित किया गया था और यह उत्पन्न होने वाली छवियों में अपनी शैली की नकल कर सकता है।

ओपनजर्नी के पीछे की कंपनी प्रॉम्प्टहीरो आपको स्टेबल डिफ्यूजन (संस्करण 1.5 और 2), ड्रीमशेपर और रियलिस्टिक विजन सहित अन्य मॉडलों के साथ मॉडल का परीक्षण करने देती है। साइन अप करते समय, आपको 25 मुफ्त क्रेडिट (प्रत्येक छवि के लिए एक क्रेडिट) मिलते हैं, जिसके बाद आपको उनके प्रो सब्सक्रिप्शन टियर की सदस्यता लेनी होगी, जिसकी लागत $9 प्रति माह है और आपको अन्य विशेष सुविधाओं के साथ हर महीने 300 क्रेडिट तक पहुंच प्रदान करता है।

The 5 Best Open-Source AI Image Generators

हालाँकि, यदि आप इसे स्थानीय रूप से और मुफ्त में चलाना चाहते हैं, तो आप हगिंगफेस से मॉडल फ़ाइल डाउनलोड कर सकते हैं और इसे स्टेबल डिफ्यूजन वेब यूआई का उपयोग करके चला सकते हैं। ओपनजर्नी, स्टेबल डिफ्यूजन के ठीक बाद, हगिंगफेस पर दूसरा सबसे अधिक डाउनलोड किया जाने वाला एआई इमेज जेनरेशन मॉडल है।

ओपनजर्नी अपनी वेबसाइट पर मॉडल को स्थानीय रूप से चलाने के लिए किसी विशिष्ट हार्डवेयर आवश्यकताओं को सूचीबद्ध नहीं करता है, लेकिन आप स्टेबल डिफ्यूजन के लिए समान हार्डवेयर आवश्यकताओं की उम्मीद कर सकते हैं। इसका मतलब है मॉडल और उसकी निर्भरता को बचाने के लिए आपके कंप्यूटर पर 4 जीबी वीआरएएम, 16 जीबी रैम और लगभग 12 से 15 जीबी खाली जगह के साथ एक समर्पित जीपीयू।

The 5 Best Open-Source AI Image Generators

जब तक अन्यथा निर्दिष्ट न किया जाए, ओपनजर्नी द्वारा उत्पन्न छवियां फोटोयथार्थवाद और कला के बीच संतुलित होती हैं। यदि आप एक ऑल-अराउंड मॉडल की तलाश में हैं और सब्सक्रिप्शन के लिए भुगतान किए बिना मिडजर्नी लुक और फील पसंद करते हैं, तो ओपनजर्नी सबसे अच्छे विकल्पों में से एक है।

विज्ञप्ति वक्तव्य यह आलेख यहां पुन: प्रस्तुत किया गया है: https://www.makeuseof.com/best-open-source-ai-image-generator/ यदि कोई उल्लंघन है, तो कृपया इसे हटाने के लिए [email protected] से संपर्क करें।
नवीनतम ट्यूटोरियल अधिक>

चीनी भाषा का अध्ययन करें

अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।

Copyright© 2022 湘ICP备2022001581号-3