يعكس Gen-2 من Runway أفضل ما ستحصل عليه باستخدام Sora من Open AI، وذلك باستخدام نظام ذكاء اصطناعي متعدد الوسائط لإنشاء مقاطع فيديو باستخدام المطالبات النصية.
تتضمن إمكانيات الجيل الثاني من Runway القدرة على تحميل الصور أو مقاطع الفيديو لاستخدامها كمرجع لمقطع الفيديو الذي ترغب في إنشائه. يبقى أن نرى ما إذا كان Sora من Open AI سيدعم أيضًا إنشاء مقاطع فيديو من الصور أو المقاطع المرجعية.
انطلاقًا من جودة المقاطع التي تم إنشاؤها بواسطة Sora والتي تشاركها OpenAI، يتفوق Sora على Runway Gen-2 كمولد تحويل النص إلى فيديو بتقنية الذكاء الاصطناعي. ومع ذلك، نظرًا لسرعة التطور في مجال الذكاء الاصطناعي (وحقيقة أن Runway أطلقت Gen-2 قبل حوالي عام من إصدار المعاينة الأولى لـ Sora)، فمن الواضح أن Sora وRunway Gen-2 من OpenAI (وإصداراتها المستقبلية) سوف تنافس للحصول على أفضل عنوان لمولد الذكاء الاصطناعي لتحويل النص إلى فيديو.
بيكا هو آخر مولد فيديو مدعوم بالذكاء الاصطناعي يمكنه إنشاء مقاطع فيديو ورسوم متحركة ثلاثية الأبعاد من المطالبات النصية والصور. Pika متاح على تطبيق الويب وDiscord. ومع ذلك، فإن النظام الأساسي الذي تستخدمه يحدد جودة الإخراج والميزات الإضافية التي يمكنك الوصول إليها.
يتيح لك تطبيق الويب تعديل مناطق معينة في مقطعك الذي تم إنشاؤه، وتوسيع لوحة الفيديو، وإضافة مزامنة الشفاه إلى مقاطع الفيديو التي تم إنشاؤها. هذه الميزات غير متوفرة في خيار خادم Discord.
ومع ذلك، أوصي بتجربة خيارات الويب وDiscord لمعرفة أيهما يمنحك نتائج أفضل. تم إنشاء المقطع أدناه على نسخة الويب الخاصة بـ Pika باستخدام نفس المطالبة مثل فيديو "Lady Walking in Tokyo" واسع الانتشار بواسطة OpenAI Sora:
A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
استخدام نفس المطالبة (/ إنشاء موجه) على خادم Pika's Discord أعطى النتيجة أدناه:
سنسمح لك بالحكم على أيهما أفضل، لكنه أفضل لدى Clear Pika بعض الأمور التي يتعين عليه اللحاق بها مقارنة بجودة المقاطع التي أنشأها Sora عبر الإنترنت. ومع ذلك، فإن ميزاته الأخرى، مثل مزامنة الشفاه والرسوم المتحركة للصور، تمنحه ميزة على Sora، على الأقل في الوقت الحالي.
Pixverse هو بديل آخر لـ Open AI's Sora الذي يتيح لك إنشاء مقاطع فيديو واقعية مع مطالبات نصية. تقدم Pixverse أيضًا منصتين لإنشاء الفيديو: منصة الويب وخادم Discord.
توفر منصة الويب الخاصة بـ Pixverse تجربة أكثر شمولاً لإنشاء الفيديو حيث يمكنك إنشاء جميع مقاطع الفيديو التي تنشئها وعرضها وتصفيتها وتحريرها.
تم إنشاء الفيديو أعلاه على نسخة الويب الخاصة بـ Pixverse. بينما يمكنك دائمًا التجديد للحصول على نتائج أفضل (إنه مجاني!)، فإن خيار خادم Discord يتمتع بميزة إنشاء أربعة مقاطع دفعة واحدة. يمنحك هذا خيار اختيار الأفضل دون التجديد عدة مرات. يوجد أدناه نموذج تم إنشاؤه على خادم Discord الخاص به:
يمكنك الانضمام إلى خادم Discord الخاص بـ Pixverse وإنشاء مقاطعك باستخدام الأمر / create. يمكنك أيضًا تحديد نسبة العرض إلى الارتفاع والمطالبة السلبية (إذا لزم الأمر) لمقاطع الفيديو الخاصة بك.
من حيث الجودة، تقع Pixverse في نفس فئة Pika — أقل من Sora.
Kaiber هي أداة إنشاء فيديو تعمل بالذكاء الاصطناعي تركز على الفنان وتسمح لك بإنشاء مقاطع فيديو من الصور أو الأوصاف النصية.
يدعم Kaiber أيضًا التفاعل الصوتي، مما يعني أنه يمكنك تحميل أغنية والسماح للذكاء الاصطناعي بإنشاء مقطع فيديو يتوافق مع إيقاع الموسيقى ومزاجها. يمكنك أيضًا تخصيص طول الفيديو الخاص بك وأبعاده وحركات الكاميرا وإطار البداية. يمكنك استخدام Kaiber على الويب أو من خلال تطبيقات الهاتف المحمول الخاصة به.
أكبر جاذبية لـ Kaiber هي قدرته على إنشاء مقاطع تتوافق مع إيقاع الأصوات التي تم تحميلها. تساعد ميزاتها التي تتمحور حول الفنان أيضًا في دعمها ضد Sora. ومع ذلك، فيما يتعلق بواقعية المقطع الذي تم إنشاؤه، لا يزال سورا واضحًا.
Synthesia هو منشئ تحويل النص إلى فيديو بتقنية الذكاء الاصطناعي والذي يسمح لك بإنشاء مقاطع فيديو ناطقة واقعية من النصوص النصية. يمكنك الاختيار من بين العديد من الصور الرمزية والخلفيات واللغات لتخصيص الفيديو الخاص بك.
يختلف Synthesia عن Sora في أنه لا يقوم بإنشاء العناصر المرئية من الصفر ولكنه يستخدم اللقطات الموجودة ويعدلها لتتناسب مع النص. يقتصر Synthesia أيضًا على مقاطع الفيديو الناطقة، بينما يستطيع Sora إنشاء أي نوع من مقاطع الفيديو من النص.
يعد Synthesia بديلاً جيدًا لـ Sora لإنشاء مقاطع فيديو جذابة وشخصية لأغراض التعليم أو التسويق أو الترفيه.
Vidnoz هو منشئ فيديو آخر يعمل بالذكاء الاصطناعي يقوم بإنشاء مقاطع فيديو ناطقة من النصوص النصية. يستخدم Vidnoz AI معالجة اللغة الطبيعية (NLP) ورؤية الكمبيوتر لإنشاء مزامنة واقعية للشفاه وتعبيرات الوجه للصور الرمزية. يمكنك أيضًا تخصيص مظهر الصور الرمزية وملابسها وملحقاتها.
Vidnoz AI يشبه Synthesia من حيث الوظيفة، ولكنه يسمح بمزيد من التخصيص عند إنشاء فيديو اختباري مجاني. يمكنك الاختيار بين الصور الرمزية والأصوات، وهو أمر لا تدعمه Synthesia.
إذا كان ما أعقب إطلاق OpenAI لـ ChatGPT هو أي شيء، فيمكنك توقع تقديم المزيد من منصات تحويل النص إلى فيديو بالذكاء الاصطناعي. يمكنك أيضًا أن تتوقع أن يصبح Lumiere من Google وMate-A-Video في متناول الجمهور.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3