هناك العشرات من مولدات تحويل النص إلى صورة المجانية والمفتوحة المصدر المعتمدة على الذكاء الاصطناعي والمتوفرة على الإنترنت والتي تتخصص في أنواع معينة من الصور. لذا، قمنا بفحص الكومة ووجدنا أفضل مولدات تحويل النص إلى صورة مفتوحة المصدر التي تعمل بالذكاء الاصطناعي والتي يمكنك تجربتها الآن.
Craiyon هو أحد أكثر مولدات الصور ذات المصدر المفتوح التي تعمل بالذكاء الاصطناعي والتي يسهل الوصول إليها. إنه يعتمد على DALL-E Mini، وبينما يمكنك استنساخ مستودع Github وتثبيت النموذج محليًا على جهاز الكمبيوتر الخاص بك، يبدو أن Craiyon قد تخلت عن هذا النهج لصالح موقعها على الويب.
لم يتم تحديث مستودع Github الرسمي منذ يونيو 2022، لكن النموذج الأحدث لا يزال متاحًا مجانًا على موقع Craiyon الرسمي. لا توجد تطبيقات Android أو iOS أيضًا.
فيما يتعلق بالوظائف، سترى جميع الخيارات المعتادة التي تتوقعها من منشئ صور يعمل بالذكاء الاصطناعي. بمجرد إدخال المطالبة والحصول على صورة، يمكنك استخدام ميزة الترقية للحصول على نسخة ذات دقة أعلى. هناك ثلاثة أنماط للاختيار من بينها: الفن والصور والرسم. يمكنك أيضًا تحديد خيار "لا شيء" إذا كنت تريد أن يقرر النموذج.
بالإضافة إلى ذلك، يتيح لك "وضع الخبير" تضمين كلمات سلبية، والتي تخبر النموذج بتجنب عناصر محددة. هناك أيضًا ميزة التنبؤ الفوري، والتي تستخدم ChatGPT لمساعدة المستخدمين على كتابة أفضل المطالبات وأكثرها تفصيلاً. وأخيرًا، يمكن أن تساعدك ميزات إزالة الخلفية المدعومة بالذكاء الاصطناعي على توفير الوقت والجهد في قص الخلفيات من الصور.
وهذا هو كل ما يفعله Craiyon. إنه ليس نموذج إنشاء صور الذكاء الاصطناعي الأكثر تطورًا، ولكنه يعمل بشكل جيد كنموذج أساسي إذا كنت لا تريد شيئًا مفصلاً أو واقعيًا.
النموذج مجاني للاستخدام، لكن المستخدمين المجانيين يقتصرون على تسع صور مجانية في المرة الواحدة خلال دقيقة واحدة. يمكنك الاشتراك في مستويات الداعم أو المحترف (بسعر 5 دولارات و20 دولارًا شهريًا، على التوالي، ويتم إصدار الفاتورة سنويًا) للحصول على عدم وجود إعلانات أو علامات مائية، وتوليد أسرع، وخيار الحفاظ على خصوصية الصور التي تم إنشاؤها. تسمح طبقة الاشتراك المخصصة أيضًا بالنماذج المخصصة والتكامل والدعم المخصص والخوادم الخاصة.
ربما يكون Stable Diffusion أحد أشهر نماذج تحويل النص إلى صورة مفتوحة المصدر. كما أنه يشغل نماذج أخرى، بما في ذلك مولدات الصور الثلاثة المذكورة أدناه. تم إصداره في عام 2022 وتم تنفيذ العديد من التطبيقات منذ ذلك الحين.
سأوفر لك التفاصيل الفنية المفرطة حول كيفية عمل النموذج (والتي يمكنك من خلالها مراجعة مستودع Github الرسمي الخاص بهم)، ولكن النموذج سهل التثبيت حتى للمبتدئين تمامًا ويعمل بشكل جيد طالما أن لديك وحدة معالجة رسومات مخصصة بذاكرة لا تقل عن 4 جيجابايت. يمكنك أيضًا الوصول إلى Stable Diffusion عبر الإنترنت، ونحن نوفر لك كل ما تحتاجه إذا كنت تريد تشغيل Stable Diffusion على جهاز Mac.
هناك العديد من نقاط التحقق (اعتبرها إصدارات) متاحة للاستخدام في النشر المستقر. بينما قمنا باختبار الإصدار 1.5، فإن الإصدار 2.1 أيضًا قيد التطوير النشط وهو أكثر دقة.
يعد تشغيل النموذج أمرًا سهلاً أيضًا. لقد قمنا باختباره باستخدام واجهة مستخدم الويب AUTOMATIC1111 Stable Diffusion، وجميع عناصر التحكم والمعلمات تعمل بشكل جيد. كما أنها مقاومة تمامًا لـ NSFW بفضل قاعدة بيانات LAION-5B التي تم تدريب النموذج عليها (على الرغم من أنها ليست مثالية، ضع في اعتبارك). على الرغم من أن وقت الإنشاء نفسه سيختلف بناءً على أجهزتك، يمكنك أن تتوقع أن تكون صورك مفصلة وواقعية حتى مع المطالبات الأساسية.
DreamShaper هو نموذج لتوليد الصور يعتمد على Stable Diffusion. كان المقصود منه أن يكون بديلاً مفتوح المصدر لـ MidJourney ويركز على الواقعية في الصور التي تم إنشاؤها، على الرغم من أنه يمكنه التعامل مع أنماط الرسوم المتحركة والرسم أيضًا مع بعض التعديلات.
النموذج أكثر قدرة من Stable Diffusion، مما يسمح للمستخدمين بمزيد من الحرية في الإخراج النهائي، بدءًا من التحسينات السريعة إلى قيود NSFW الأكثر مرونة. يعد تشغيل النموذج أمرًا سهلاً أيضًا، مع توفر إصدار مدرب مسبقًا وقابل للتنزيل عبر الإنترنت للوصول المحلي ومجموعة من مواقع الويب، بما في ذلك Sinkin.ai وRandomSeed وMage.space (يتطلب اشتراكًا أساسيًا) التي تتيح لك تشغيل النموذج باستخدام تسريع GPU.
كما يمكنك التخمين الآن، تميل الصور التي تم إنشاؤها بواسطة DreamShaper إلى أن تبدو أكثر واقعية مقارنة بـ Stable Diffusion. حتى إذا قمت بتشغيل نفس الموجه على كلا النموذجين، فمن المرجح أن يكون نموذج DreamShaper أكثر واقعية وتفصيلاً وأفضل إضاءة.
هذا ينطبق بشكل خاص على الصور الشخصية أو الشخصيات، وهو شيء وجدت أن Stable Diffusion يفتقر إليه مقارنة بنفس الموجه. إذا أصبحت صورك واقعية للغاية، فإليك أربع طرق للتعرف على الصورة التي تم إنشاؤها بواسطة الذكاء الاصطناعي.
لا تحتاج إلى جهاز كمبيوتر ضخم لتشغيل النموذج أيضًا. قام جهاز GTX 1650Ti المزود بذاكرة VRAM سعة 4 جيجابايت بتشغيل النموذج بشكل مثالي. كان وقت الإنشاء أطول قليلاً، لكن لا يبدو أنه يؤثر على الناتج الفعلي. ومع ذلك، قد تحتاج إلى وحدات معالجة رسومات بها المزيد من VRAM لتشغيل DreamShaper XL، والذي يعتمد على طراز Stable Diffusion XL.
Invocation AI هو نموذج آخر لإنشاء الصور يعتمد على الذكاء الاصطناعي يعتمد على Stable Diffusion، مع إصدار XL يعتمد على Stable Diffusion XL. كما أن لديها واجهة مستخدم خاصة بها على الويب وسطر الأوامر، مما يعني أنك لن تضطر إلى القفز فوق أشياء مثل واجهة مستخدم الويب Stable Diffusion.
يركز النموذج على السماح للمستخدمين بإنشاء صور مرئية بناءً على ملكيتهم الفكرية من خلال سير عمل مخصص. يعد InvocAI أحد أفضل نماذج إنشاء صور الذكاء الاصطناعي مفتوحة المصدر لتدريب النماذج المخصصة والعمل مع الملكية الفكرية.
يسرد مستودع Github الرسمي الخاص به طريقتين للتثبيت: التثبيت عبر مثبت InvocAI أو استخدام PyPI إذا كنت مرتاحًا مع الوحدة الطرفية وPython وتحتاج إلى مزيد من التحكم في الحزم المثبتة مع النموذج.
ومع ذلك، فإن التحكم الإضافي يجلب بعض القيود، أبرزها متطلبات الأجهزة الأكثر صرامة. توصي InvocAI بوحدة معالجة رسومات مخصصة بذاكرة لا تقل عن 4 جيجابايت، ويوصى باستخدام ستة إلى ثمانية جيجابايت لتشغيل متغير XL. تنطبق متطلبات VRAM على كل من وحدات معالجة الرسوميات AMD وNvidia. ستحتاج أيضًا إلى ما لا يقل عن 12 جيجابايت من ذاكرة الوصول العشوائي (RAM) و12 جيجابايت من مساحة القرص الحرة للنموذج وتبعياته وPython.
على الرغم من أن الوثائق لا توصي باستخدام وحدات معالجة الرسوميات Nvidia's GTX 10 Series و16 Series بسبب افتقارها إلى ذاكرة الفيديو، إلا أن برنامج التثبيت المقدم يعمل بشكل جيد. على الرغم من أن المسافة المقطوعة قد تختلف، إذا كنت تستخدم وحدة معالجة رسومات منخفضة المستوى، فتوقع الانتظار لفترة أطول لرؤية مطالباتك تتحول إلى صور. أخيرًا، إذا كنت تستخدم نظام التشغيل Windows، فيمكنك فقط استخدام وحدة معالجة الرسومات Nvidia، حيث لا يوجد دعم لوحدات معالجة الرسوميات AMD حاليًا.
بالنسبة لجزء توليد الصور، يميل النموذج إلى الميل نحو الأساليب الفنية أكثر من الواقعية. بالطبع، يمكنك تدريب النموذج على مجموعة البيانات الخاصة بك وجعله ينشئ صورًا أقرب إلى ما تريد، حتى لو كان ذلك يتضمن صورًا واقعية، خاصة إذا كنت تعمل في تصميم المنتجات، أو الهندسة المعمارية، أو مساحات البيع بالتجزئة. ومع ذلك، هناك شيء مهم يجب أخذه في الاعتبار وهو أن InvocAI هو في المقام الأول محرك لتوليد الصور، مما يعني أنه سيتعين عليك على الأرجح استخدام النماذج الخاصة بك للحصول على أفضل النتائج (يمكن العثور عليها بسهولة عبر مدير النماذج المتوفر في واجهة الويب) كمحرك افتراضي. النموذج مشابه تمامًا لـ Stable Diffusion نفسه.
Openjourney هو نموذج مجاني ومفتوح المصدر لإنشاء صور الذكاء الاصطناعي يعتمد مرة أخرى على Stable Diffusion. إذا كنت تتساءل عن سبب تسمية النموذج بـ Openjourney، فذلك لأنه تم تدريبه على صور Midjourney ويمكنه تقليد أسلوبه في الصور التي ينشئها.
تتيح لك شركة PromptHero، الشركة التي تقف وراء Openjourney، اختبار النموذج جنبًا إلى جنب مع نماذج أخرى، بما في ذلك Stable Diffusion (الإصداران 1.5 و2)، وDreamShaper، وRealistic Vision. عند التسجيل، تحصل على 25 رصيدًا مجانيًا (رصيدًا واحدًا لكل صورة يتم إنشاؤها)، وبعد ذلك يتعين عليك الاشتراك في فئة الاشتراك الاحترافي، والتي تكلف 9 دولارات شهريًا وتمنحك الوصول إلى 300 رصيدًا كل شهر مع ميزات حصرية أخرى.
ومع ذلك، إذا كنت تريد تشغيله محليًا ومجانًا، فيمكنك تنزيل ملف النموذج من HuggingFace وتشغيله باستخدام واجهة مستخدم الويب Stable Diffusion. يعد Openjourney أيضًا ثاني أكثر نماذج إنشاء صور الذكاء الاصطناعي تنزيلًا على HuggingFace، مباشرة بعد Stable Diffusion.
لا يدرج Openjourney أي متطلبات أجهزة محددة لتشغيل النموذج محليًا على موقعه على الويب، ولكن يمكنك توقع متطلبات أجهزة مماثلة لـ Stable Diffusion. وهذا يعني وجود وحدة معالجة رسومات مخصصة مزودة بذاكرة VRAM سعة 4 جيجابايت وذاكرة وصول عشوائي سعة 16 جيجابايت وحوالي 12 إلى 15 جيجابايت من المساحة الحرة على جهاز الكمبيوتر الخاص بك لحفظ النموذج وتبعياته.
تميل الصور التي تم إنشاؤها بواسطة Openjourney إلى الموازنة بين الواقعية والفن ما لم ينص على خلاف ذلك. إذا كنت تبحث عن نموذج شامل وتفضل شكل ومظهر Midjourney دون دفع ثمن الاشتراك، فإن Openjourney هو أحد أفضل الخيارات.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3