يأتي Google Gemini 1.5 الآن مزودًا بنافذة سياق ضخمة تضم مليون رمز مميز، مما يقزم منافستها المباشرة في ChatGPT وClaude وغيرها من روبوتات الدردشة التي تعمل بالذكاء الاصطناعي.
يبدو الأمر وكأنه ترقية هائلة ويمكن أن يميز الجوزاء عن الآخرين. من الصعب بعض الشيء فهم مداها الكامل، لكن نافذة السياق الهائلة لـ Gemini يمكن أن تغير قواعد اللعبة.
أثناء الرد على استفساراتك، مثل شرح مفهوم أو تلخيص نص، فإن نماذج الذكاء الاصطناعي لديها حدود لكمية البيانات التي يمكنها أخذها في الاعتبار لتوليد الاستجابة. يُطلق على الحد الأقصى لحجم النص الذي يمكن مراعاته اسم نافذة السياق.
إليك طريقة أخرى للنظر إلى الأمر. لنفترض أنك ذهبت إلى محل بقالة لشراء البقالة بدون قائمة البقالة الخاصة بك. الحد الأقصى لعدد البقالة التي تتذكرها عند التسوق هو نافذة السياق الخاصة بك. كلما زاد عدد البقالة التي يمكنك تذكرها، زادت فرص عدم إفساد خطط التسوق الخاصة بك. وبالمثل، كلما كانت نافذة السياق لنموذج الذكاء الاصطناعي أكبر، زادت فرص النموذج في تذكر كل ما يحتاجه لتزويدك بأفضل النتائج.
في وقت كتابة هذا التقرير، تعد نافذة سياق Anthropic's Claude 2.1 بحجم 200 كيلو بايت أكبر نافذة سياق لأي نموذج ذكاء اصطناعي متاح بشكل عام. ويتبع ذلك GPT-4 Turbo مع نافذة سياق بحجم 128 كيلو بايت. يوفر Google Gemini 1.5 نافذة سياقية تضم مليونًا، أي أكبر بأربع مرات من أي شيء آخر في السوق. يؤدي هذا إلى السؤال الكبير: ما المشكلة الكبيرة في نافذة سياق مكونة من مليون رمز مميز؟
لوضع الأمر في منظور أكثر وضوحًا، فإن نافذة سياق Claude AI التي يبلغ حجمها 200 ألف تعني أنه يمكنه استيعاب كتاب يضم حوالي 150000 كلمة و تقديم إجابات لذلك. هذا ضخم. لكن Google Gemini 1.5 سيكون قادرًا على استيعاب 700000 كلمة دفعة واحدة!
عندما تقوم بتغذية كتلة نصية كبيرة في روبوتات الدردشة المدعومة بالذكاء الاصطناعي مثل ChatGPT أو Gemini، فإنها تحاول استيعاب أكبر قدر ممكن من النص، ولكن مقدار ما يمكنها استيعابه يعتمد على نافذة السياق الخاصة بها. لذلك، إذا كانت لديك محادثة تصل إلى 100 ألف كلمة على نموذج يمكنه التعامل مع 28 ألف كلمة فقط، ثم تبدأ في طرح الأسئلة التي تتطلب منه أن يكون لديه معرفة كاملة بمجموع 100 ألف كلمة من المحادثة، فأنت تقوم بإعدادها للفشل.
تخيل أنك تشاهد 20 دقيقة فقط من فيلم مدته ساعة واحدة ولكن يُطلب منك شرح الفيلم بأكمله. إلى أي مدى ستكون نتائجك جيدة؟ إما أن ترفض الإجابة أو تقوم ببساطة باختلاق أشياء، وهو بالضبط ما سيفعله برنامج الدردشة الآلي الذي يعمل بالذكاء الاصطناعي، مما يؤدي إلى هلوسة الذكاء الاصطناعي.
الآن، إذا كنت تعتقد أنك لم تضطر مطلقًا إلى إدخال 100 ألف كلمة في برنامج الدردشة الآلي، فهذا ليس كل الاعتبارات. تتجاوز نافذة السياق النص الذي تغذيه نموذج الذكاء الاصطناعي في موجه واحد فقط. تأخذ نماذج الذكاء الاصطناعي في الاعتبار المحادثة بأكملها التي أجريتها أثناء جلسة الدردشة للتأكد من أن ردودها ذات صلة قدر الإمكان.
لذلك، على الرغم من أنك لا تقوم بإطعامه كتابًا مكونًا من 100 ألف كلمة، فإن محادثاتك ذهابًا وإيابًا والردود التي يقدمها كلها تضيف إلى حساب نافذة السياق. هل تتساءل لماذا يستمر ChatGPT أو Gemini من Google في نسيان الأشياء التي قلتها له سابقًا في المحادثة؟ من المحتمل أن مساحة نافذة السياق قد نفدت وبدأت في نسيان الأشياء.
تعد نافذة السياق الأكبر ذات أهمية خاصة للمهام التي تتطلب فهمًا عميقًا للسياق، مثل تلخيص المقالات الطويلة، أو الإجابة على الأسئلة المعقدة، أو الحفاظ على سرد متماسك في النص الذي تم إنشاؤه. هل تريد كتابة رواية مكونة من 50 ألف كلمة تحتوي على سرد متسق طوال الوقت؟ هل تريد نموذجًا يمكنه "المشاهدة" والإجابة على الأسئلة في ملف فيديو مدته ساعة واحدة؟ أنت بحاجة إلى نافذة سياق أكبر!
باختصار، قد تعمل نافذة السياق الأكبر لـ Gemini 1.5 على تحسين أداء نموذج الذكاء الاصطناعي بشكل كبير، مما يقلل من الهلوسة ويزيد بشكل كبير من الدقة والقدرة على اتباع التعليمات بشكل أفضل.
إذا سارت الأمور كما هو مخطط لها، فمن المحتمل أن يتفوق Gemini 1.5 على أفضل نماذج الذكاء الاصطناعي في السوق. ومع ذلك، وبالنظر إلى إخفاقات جوجل العديدة في بناء نموذج مستقر للذكاء الاصطناعي، فمن المهم توخي الحذر. إن رفع نافذة السياق الخاصة بالنموذج وحده لا يؤدي إلى تحسين النموذج تلقائيًا.
لقد استخدمت نافذة سياق Claude 2.1 بحجم 200 كيلو بايت لعدة أشهر منذ إصدارها، وهناك شيء واحد واضح بالنسبة لي - يمكن لنافذة سياق أكبر بالفعل تحسين حساسية السياق، ولكن المشكلات المتعلقة بأداء النموذج الأساسي يمكن أن تجعل سياق أكبر مشكلة خاصة بها.
هل سيغير لنا Google Gemini 1.5 قواعد اللعبة؟ تمتلئ وسائل التواصل الاجتماعي حاليًا بمراجعات متوهجة لـ Gemini 1.5 من مستخدمي الوصول المبكر. ومع ذلك، فإن معظم التقييمات ذات الخمس نجوم تنبع من حالات الاستخدام المتسرعة أو المبسطة. المكان الجيد للتحقق من أداء Gemini 1.5 في البرية هو داخل التقرير الفني لـ Google Gemini 1.5 [PDF]. ويظهر التقرير أنه حتى أثناء "الاختبار الخاضع للرقابة"، لم يتمكن النموذج من استرداد جميع التفاصيل الدقيقة للمستندات بشكل جيد ضمن حجم نافذة السياق الخاصة به.
تعد نافذة السياق المكونة من مليون رمز مميز بالفعل إنجازًا تقنيًا مثيرًا للإعجاب، ولكن دون القدرة على استرداد تفاصيل المستند بشكل موثوق، فإن نافذة السياق الأكبر تكون ذات قيمة عملية قليلة ويمكن أن تصبح سببًا للانخفاض الدقة والهلوسة.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3