それで、GPT-4o とは何ですか?
GPT-4o は、ChatGPT 開発者の OpenAI の最新 AI モデルで、2024 年 5 月初旬の「Spring Update」イベントで公開されました。少なくとも現時点では、以前の最高性能モデルである GPT-4 Turbo と共存し、ツールに膨大な数のアップデートが行われます。
前世代とは異なり、GPT-4o は発売当初から完全にマルチモーダルです (モデル名の「o」は「オムニモーダル」を表します)。 OpenAI の Spring Update イベントでは、GPT-4o がイベント主催者と流暢に会話し、インタラクション間で切断および変更を行い、「個性」を披露し、ユーザーが夢見てきた仮想アシスタントになる方法を示しました。
オーディオ、テキスト、画像、ビデオの組み合わせを入出力として受け入れ、テキスト、オーディオ、画像で出力できます (ビデオはまだサポートされていませんが、OpenAI の Sora テキストからビデオへのツールが登場すると変更される予定です)が起動します—少なくとも、これが起こると私は推測しています)。
OpenAI によって提供される生の数値に関しては、GPT-4o は、Claude 3 Opus、Gemini Pro 1.5 および Ultra 1.0、Llama 3 400B などの最も近い競合製品とともに、以前のモデルすべてを上回っています。
さて、数字はすべて非常に良好ですが、これは実際には何を意味するのでしょうか?さて、繰り返しになりますが、OpenAI の数値から考えると、GPT-4o は、英語の執筆とコーディングに関しては「GPT-4 Turbo のパフォーマンスに匹敵」し、「英語以外の言語」では大幅に高速であり、そして最も重要なことに、API の点では高速かつ安価です。使用。
私はテクノロジー業界で長い間働いており、多くのピカピカの新しい「ゲームチェンジャー」が登場しては消えていくのを見てきました。しかし、GPT-4oの会話スピーチは本当に素晴らしいです。 GPT-4o は、会話を中断したり、会話の焦点を変更したり、話題を変更したりすることも、ほとんど中断することなく、適切な会話を行うことができます。
迅速に会話できるその能力により、さまざまな新しいアプリケーションが可能になります。 ChatGPT にはすでに音声機能がありましたが、最初に応答を作成してから話しかける必要があるため、機能には制限がありました。音声を使用して ChatGPT と対話することもできますが、リクエストの処理に時間がかかります。
これで、GPT-4o のリアルタイム音声はほぼシームレスになりました。さらに、今回のアップデート前には不可能だった感情や特定のスタイルを表現することもできます。
これはライブ翻訳にも当てはまり、GPT-4o では大幅な改善が見られました。私は他の言語には詳しくありませんが、英語からイタリア語へのライブ翻訳は好評でした。海外にいるときのコミュニケーションを容易にするものは、特に翻訳のスピードを考えると大きな恩恵となるでしょう。
私は最近モロッコにいたのですが、Google 翻訳を使って意味をアラビア語に理解するのに役立ちましたが、翻訳の内容全体が完全に正確であるとは限りません。 GPT-4o のライブ翻訳は非常に便利だったでしょう。
GPT-4o は、マルチモーダル機能を使用してコード解釈と支援を大幅にアップグレードします。他のツールと同様に、ChatGPT はすでに一部のデータを処理できますが、その新しいモデルではこれが大幅に強化されています。
音声だけを使用してコードをデバッグできる機能は注目に値します。ただし、その実際の用途は、実際のプログラマーや開発者がツールを使用し始めて初めて明らかになります。 ChatGPT のコーディング能力は便利ですが、ほとんどの生成 AI ツールと同様、ユーザーの知識と同じくらい役に立ちます。
GPT-4o は、月額 20 ドルを支払う ChatGPT Plus 加入者向けにすぐにリリースされました。しかし、生成 AI にとってもう一つの大きな瞬間として、OpenAI は GPT-4o がやがて無料ユーザーを含むすべてのユーザー向けにリリースされることを明らかにしました。
GPT-4o が無料 ChatGPT 無料アカウントに公開される具体的な日付はありませんが、他の展開の速度を考慮すると、それほど長くはかからないはずです。
新しいモデルの他の側面もまだ利用できません。たとえば、この記事用に新しいライブ音声機能の短いクリップを作成したいと思いましたが、この機能はまだ開始されておらず (私は ChatGPT Plus の長期購読者です)、同僚のどの機能にも導入されていません。アカウント。
GPT-4o では、macOS から始まる待望の ChatGPT デスクトップ バージョンも提供されますが、これもまだリリースされていません。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3