Runway の Gen-2 は、Open AI の Sora を使用して得られるものを最もよく反映しており、マルチモーダル AI システムを使用してテキスト プロンプトを使用してビデオ クリップを生成します。
Runway の Gen-2 機能には、生成するビデオ クリップのリファレンスとして使用する画像またはビデオをアップロードする機能が含まれています。 Open AI の Sora が参照画像やクリップからのビデオ クリップの作成もサポートするかどうかはまだわかりません。
OpenAI によって共有された Sora が生成したクリップの品質から判断すると、Sora は AI テキストからビデオへのジェネレーターとして Runway Gen-2 よりも優れています。しかし、AI 分野の開発のスピード (そして、Sora の最初のプレビューがリリースされる約 1 年前に Runway が Gen-2 を立ち上げたという事実) を考慮すると、OpenAI の Sora と Runway Gen-2 (およびその将来のバージョン) は明らかにテキストからビデオへの AI ジェネレーターの最高のタイトルを目指して戦います。
Pika は別のものですAI を活用したビデオ ジェネレーター。テキスト プロンプトや画像からビデオや 3D アニメーションを作成できます。 Pika は Web アプリと Discord で利用できます。ただし、使用するプラットフォームによって、出力品質とアクセスできる追加機能が決まります。
Web アプリを使用すると、生成されたクリップ内の特定の領域を変更したり、ビデオ キャンバスを拡張したり、生成されたビデオにリップ シンクを追加したりできます。これらの機能は、Discord サーバー オプションでは利用できません。
とはいえ、Web オプションと Discord オプションを試して、どちらがより良い結果をもたらすかを確認することをお勧めします。以下のクリップは、OpenAI Sora によるバイラルな「東京を歩く女性」ビデオと同じプロンプトを使用して、Pika の Web バージョンで生成されました。
A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
Pika の Discord サーバーで同じプロンプト (/create プロンプト) を使用すると、次の結果が得られました:
どちらが良いかは皆さんの判断にお任せしますが、 Sora がオンラインで生成したクリップの品質と比較して、Pika には追いつく必要があることは明らかです。ただし、口パクや画像アニメーションなどの他の機能は、少なくとも現時点では、Sora よりも優れています。
Pixverse は、Open AI の Sora のもう 1 つの代替品で、テキスト プロンプト付きのリアルなビデオを作成できます。 Pixverse では、ビデオ作成用に Web プラットフォームと Discord サーバーという 2 つのプラットフォームも提供しています。
Pixverse の Web プラットフォームは、生成したすべてのビデオを作成、表示、フィルタリング、編集できる、より包括的なビデオ作成エクスペリエンスを提供します。
上のビデオは Pixverse の Web バージョンで生成されました。より良い結果を得るためにいつでも再生成できますが (無料です!)、Discord サーバー オプションには一度に 4 つのクリップを生成できるという利点があります。これにより、何度も再生成せずに最適なものを選択するオプションが提供されます。以下は Discord サーバーで生成されたサンプルです:
Pixverse の Discord サーバーに参加し、/create コマンドを使用してクリップを生成できます。ビデオのアスペクト比と否定的なプロンプト (必要な場合) を選択することもできます。
品質の点で、Pixverse は、Sora の下、Pika と同じクラスに属します。
Kaiber は、画像やテキストの説明からビデオを作成できる、アーティストに特化した AI ビデオ生成ツールです。
Kaiber はオーディオの反応性もサポートしています。つまり、曲をアップロードすると、音楽のリズムや雰囲気にマッチするビデオを AI に生成させることができます。ビデオの長さ、寸法、カメラの動き、開始フレームをカスタマイズすることもできます。 Kaiber はウェブ上またはモバイル アプリを通じて使用できます。
Kaiber の最大の魅力は、アップロードされたサウンドのリズムに合わせてクリップを生成できることです。アーティスト中心の機能もソラに対抗するのに役立ちます。ただし、生成されたクリップのリアリズムという点では、Sora の方が優れています。
Synthesia は、テキスト スクリプトからリアルなトーキング ビデオを作成できる AI テキストからビデオへのジェネレーターです。さまざまなアバター、背景、言語から選択してビデオをカスタマイズできます。
Synthesia は、ビジュアルを最初から生成するのではなく、既存の映像を使用し、テキストに一致するように変更するという点で Sora とは異なります。 Synthesia はトークビデオに限定されていますが、Sora はテキストからあらゆる種類のビデオを生成できます。
Synthesia は、教育、マーケティング、エンターテイメント目的で魅力的でパーソナライズされたビデオを作成するための Sora の優れた代替手段です。
Vidnoz は、トーキング ビデオを作成する別の AI ビデオ ジェネレーターですテキストスクリプトから。 Vidnoz AI は、自然言語処理 (NLP) とコンピューター ビジョンを使用して、アバターのリアルな口パクと表情を生成します。アバターの外観、服装、アクセサリーをカスタマイズすることもできます。
Vidnoz AI は機能の点では Synthesia に似ていますが、無料のテスト ビデオを作成するときにさらにカスタマイズできます。アバターと音声のどちらかを選択できますが、Synthesia はサポートしていません。
OpenAI による ChatGPT のリリースに続いて何が起こるかというと、さらに多くの AI テキスト動画変換プラットフォームが導入されることが期待できます。 Google の Lumiere と Meta の Make-A-Video が一般に公開されることも期待できます。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3