Google Gemini 1.5 には、100 万トークンという大規模なコンテキスト ウィンドウが搭載されており、ChatGPT、Claude、その他の AI チャットボットにおける直接の競合を小さくしています。
それは大規模なアップグレードのように聞こえ、Gemini を際立たせる可能性があります。その全容を把握するのは少し難しいですが、Gemini の巨大なコンテキスト ウィンドウはゲームチェンジャーになる可能性があります。
コンセプトの説明やテキストの要約などのクエリに応答する際、AI モデルが応答を生成するために考慮できるデータの量には制限があります。考慮できるテキスト サイズの制限は、コンテキスト ウィンドウと呼ばれます。
別の見方もできます。食料品リストを持たずに食料品を買いに食料品店に行ったとします。買い物の際に覚えておく食料品の数の制限は、コンテキスト ウィンドウによって決まります。覚えている食料品が多ければ多いほど、買い物計画を台無しにしない可能性が高くなります。同様に、AI モデルのコンテキスト ウィンドウが大きいほど、最良の結果を提供するために必要なすべてをモデルが記憶する可能性が高くなります。
この記事の執筆時点では、Anthropic の Claude 2.1 の 200k コンテキスト ウィンドウは、一般に利用可能な AI モデルの中で最大のコンテキスト ウィンドウです。これに、128k コンテキスト ウィンドウを備えた GPT-4 Turbo が続きます。 Google Gemini 1.5 は、市場にあるものよりも 4 倍大きい 100 万個のコンテキスト ウィンドウを実現します。これは大きな疑問につながります。100 万トークンのコンテキスト ウィンドウで何が問題になるのでしょうか?
より明確な観点から言えば、Claude AI の 200k コンテキスト ウィンドウは、約 150,000 語の本を消化できることを意味します。それに答えを提供します。それは大規模です。しかし、Google の Gemini 1.5 は一度に 700,000 語を消化できるでしょう。
ChatGPT や Gemini などの AI チャットボットに大きなテキスト ブロックをフィードすると、できるだけ多くのテキストを消化しようとしますが、どれだけ消化できるかはコンテキスト ウィンドウによって異なります。したがって、28,000 語しか処理できないモデルで 100,000 語に達する会話を行った後、100,000 語に相当する会話全体について完全な知識を必要とする質問をし始めると、失敗するように設定していることになります。
1 時間の映画のうち 20 分しか見ていないのに、映画全体の説明を求められることを想像してみてください。どれくらい良い結果が得られるでしょうか?回答を拒否するか、単にでっち上げてしまうかのどちらかですが、これはまさに AI チャットボットが行うことと同じであり、AI の幻覚を引き起こします。
さて、チャットボットに 100,000 ワードを入力する必要がなかったと思っているなら、それが考慮事項のすべてではありません。コンテキスト ウィンドウは、単一のプロンプトで AI モデルに入力するテキストだけを超えます。 AI モデルは、チャット セッション中の会話全体を考慮して、応答が可能な限り関連性のあるものであることを確認します。
つまり、10 万語の単語帳を入力していなくても、往復の会話や応答がすべてコンテキスト ウィンドウの計算に追加されます。 ChatGPT または Google の Gemini が、会話の前半で話した内容をなぜ忘れ続けるのか不思議に思いませんか?コンテキスト ウィンドウのスペースが不足し、内容を忘れ始めた可能性があります。
コンテキスト ウィンドウが大きいことは、長い記事の要約、複雑な質問への回答、生成されたテキストの一貫した説明の維持など、コンテキストの深い理解を必要とするタスクに特に重要です。全体を通して一貫した物語を持つ 50,000 語の小説を書きたいですか? 1 時間のビデオ ファイルを「見て」質問に答えることができるモデルが必要ですか?より大きなコンテキスト ウィンドウが必要です。
つまり、Gemini 1.5 のより大きなコンテキスト ウィンドウは、AI モデルのパフォーマンスを大幅に向上させ、幻覚を軽減し、精度と指示に従う能力を大幅に向上させる可能性があります。
すべてが計画通りに進めば、Gemini 1.5 は市場で最高の AI モデルを上回るパフォーマンスを発揮する可能性があります。ただし、安定した AI モデルの構築において Google が何度も失敗したことを考慮すると、慎重になることが重要です。モデルのコンテキスト ウィンドウを強化するだけでは、自動的にモデルが改善されるわけではありません。
私は Claude 2.1 の 200k コンテキスト ウィンドウをリリース以来数か月間使用してきましたが、1 つ明らかなことは、コンテキスト ウィンドウを大きくすると確かにコンテキストの感度が向上しますが、コア モデルのパフォーマンスに問題が発生して、より大きな文脈では、それ自体が問題になります。
Google Gemini 1.5 はゲームチェンジャーをもたらすでしょうか?ソーシャル メディアは現在、早期アクセス ユーザーによる Gemini 1.5 の熱烈なレビューで溢れています。ただし、5 つ星のレビューのほとんどは、性急な使用例または簡略化された使用例に基づいています。 Gemini 1.5 が実際にどのように動作するかを確認するには、Google の Gemini 1.5 技術レポート [PDF] を参照してください。このレポートは、「制御されたテスト」中であっても、モデルがコンテキスト ウィンドウのサイズ内でドキュメントの小さな詳細をすべて取得できなかったことを示しています。
100 万トークンのコンテキスト ウィンドウは確かに素晴らしい技術的偉業ですが、ドキュメントの詳細を確実に取得できなければ、より大きなコンテキスト ウィンドウは実用的な価値がほとんどなく、トークンの減少の原因になる可能性さえあります。正確さと幻覚。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3