"إذا أراد العامل أن يؤدي عمله بشكل جيد، فعليه أولاً أن يشحذ أدواته." - كونفوشيوس، "مختارات كونفوشيوس. لو لينجونج"
الصفحة الأمامية > منظمة العفو الدولية > GPT-5: 4 ميزات جديدة نريد رؤيتها

GPT-5: 4 ميزات جديدة نريد رؤيتها

تم النشر بتاريخ 2024-08-17
تصفح:370

على الأقل هذا ما نأمله. لا يوجد تاريخ محدد لإطلاق GPT-5، ومعظم ما نعتقد أننا نعرفه يأتي من تجميع المعلومات الأخرى ومحاولة ربط النقاط.

ومع ذلك، بغض النظر عن تاريخ الاستحقاق، هناك بعض الميزات الرئيسية التي نريد رؤيتها عند إطلاق GPT-5.

ما هو GPT-5 الخاص بـ OpenAI؟

يعد GPT-5 هو الوريث المرتقب لنموذج GPT-4 AI الخاص بـ OpenAI، والذي من المتوقع على نطاق واسع أن يكون أقوى نموذج توليدي في السوق. على الرغم من أنه لا يوجد حاليًا تاريخ إصدار رسمي لـ GPT-5، إلا أن هناك دلائل تشير إلى أنه يمكن إصداره في وقت مبكر من صيف عام 2024. ولا يُعرف سوى القليل جدًا من التفاصيل حول النموذج في هذا الوقت، ولكن يمكن قول العديد من الأشياء بقدر من الثقة. اليقين:

قدمت OpenAI علامة تجارية للاسم لدى مكتب براءات الاختراع والعلامات التجارية بالولايات المتحدة. ناقش العديد من المديرين التنفيذيين في OpenAI أو ألمحوا إلى القدرات المحتملة للنموذج. ذكر سام ألتمان، الرئيس التنفيذي لشركة OpenAI، النموذج مرارًا وتكرارًا خلال مقابلة على اليوتيوب في مارس 2024 مع ليكس فريدمان.

تشير كل هذه الأمور إلى حقيقة واحدة مثيرة: GPT-5 قادم! ومع ذلك، فإن الكثير من الأشياء هي مجرد تكهنات في هذه المرحلة. ولكن هناك بعض الأشياء التي نأمل أن نراها ونحن واثقون إلى حد ما من رؤيتها في النموذج. فيما يلي بعض منها:

1. المزيد من الوسائط المتعددة

GPT-5: 4 New Features We Want to See

كانت تعدد الوسائط إحدى التحسينات الأكثر إثارة لمجموعة GPT من نماذج الذكاء الاصطناعي. من أجل الوضوح، تعدد الوسائط هو قدرة نموذج الذكاء الاصطناعي على معالجة أكثر من مجرد نص ولكن أيضًا أنواع أخرى من المدخلات مثل الصور والصوت والفيديو. ستكون تعدد الوسائط بمثابة معيار تقدم مهم لمجموعة نماذج GPT في المستقبل.

مع مهارة GPT-4 بالفعل في التعامل مع مدخلات ومخرجات الصور، تعد التحسينات التي تغطي معالجة الصوت والفيديو هي الإنجاز التالي لـ OpenAI، ويعد GPT-5 مكانًا جيدًا للبدء. تحرز Google بالفعل تقدمًا جديًا في هذا النوع من الوسائط المتعددة من خلال نموذج Gemini AI الخاص بها. سيكون من غير المعتاد أن لا تستجيب OpenAI. لكن، بالطبع، لا تأخذ كلمتنا على محمل الجد. في البودكاست الخاص به Unconfuse Me [نسخة PDF]، سأل بيل جيتس الرئيس التنفيذي لشركة OpenAI، سام ألتمان، عن المعالم الرئيسية التي يتوقعها لسلسلة GPT في العامين المقبلين. إجابته الأولى؟ معالجة الفيديو.

لذا، بالنسبة لـ GPT-5، نتوقع أن نكون قادرين على التعامل مع مقاطع الفيديو — تحميل مقاطع الفيديو كمطالبات، وإنشاء مقاطع فيديو أثناء التنقل، وتحرير مقاطع الفيديو باستخدام مطالبات نصية، واستخراج مقاطع من مقاطع الفيديو، والعثور على مشاهد محددة من ملفات الفيديو الكبيرة. نتوقع أن نكون قادرين على القيام بأشياء مماثلة للملفات الصوتية. إنه طلب كبير، نعم. ولكن بالنظر إلى مدى سرعة تطور الذكاء الاصطناعي، فهو توقع معقول جدًا.

2. نافذة سياق أكبر وأكثر كفاءة

GPT-5: 4 New Features We Want to See

على الرغم من كونها واحدة من نماذج الذكاء الاصطناعي الأكثر تطورًا في السوق، إلا أن عائلة GPT من نماذج الذكاء الاصطناعي لديها واحدة من أصغر نوافذ السياق. على سبيل المثال، يتميز Claude 3 من Anthropic بنافذة سياق مكونة من 200000 رمز مميز، بينما يمكن لـ Gemini من Google معالجة مليون رمز مذهل (128000 للاستخدام القياسي). في المقابل، يحتوي GPT-4 على نافذة سياق أصغر نسبيًا تبلغ 128000 رمزًا مميزًا، مع ما يقرب من 32000 رمزًا مميزًا أو أقل متاحة بشكل واقعي للاستخدام على واجهات مثل ChatGPT.

مع ظهور الوسائط المتعددة المتقدمة في الصورة، أصبح تحسين نافذة السياق أمرًا لا مفر منه تقريبًا. ربما تكون الزيادة بعامل اثنين أو أربعة كافية، لكننا نأمل أن نرى شيئًا مثل عامل العشرة. سيسمح هذا لـ GPT-5 بمعالجة المزيد من المعلومات بطريقة أكثر كفاءة. الآن، لا تعني نافذة السياق الأكبر دائمًا الأفضل. لذا، بدلاً من مجرد زيادة نافذة السياق، نود أن نرى زيادة في كفاءة معالجة السياق.

كما ترى، قد يحتوي النموذج على نافذة سياق مليون رمز مميز (سعة حوالي 700000 كلمة) ولكنه يفشل في إنتاج ملخص شامل عندما يُطلب منه تلخيص كتاب مكون من 500000 كلمة لأنه لا يمكنه معالجة الكتاب بالكامل بشكل مناسب للسياق على الرغم من وجود القدرة على القيام بذلك من الناحية النظرية. إن قدرتك على قراءة كتاب مكون من 500 ألف كلمة لا يعني أنه يمكنك تذكر كل شيء فيه أو معالجته بشكل معقول.

3. وكلاء GPT

GPT-5: 4 New Features We Want to See ربما يكون أحد أكثر الاحتمالات إثارة لإصدار GPT-5 هو الظهور الأول لوكلاء GPT. في حين أنه من المحتمل أن يكون مصطلح "مغير قواعد اللعبة" قد تم الإفراط في استخدامه في الذكاء الاصطناعي، فإن عملاء GPT سيغيرون قواعد اللعبة بكل معنى الكلمة. ولكن إلى أي حد سيغير هذا قواعد اللعبة؟

حاليًا، يمكن لنماذج الذكاء الاصطناعي مثل GPT-4 مساعدتك في إكمال المهمة. يمكنهم كتابة بريد إلكتروني، أو فك نكتة، أو حل مسألة رياضية، أو صياغة مشاركة مدونة لك. ومع ذلك، يمكنهم فقط القيام بهذه المهمة المحددة ولا يمكنهم إكمال مجموعة من المهام ذات الصلة التي قد تكون ضرورية لإكمال عملك.

لنفترض أنك مطور ويب. كجزء من وظيفتك، يُتوقع منك القيام بالعديد من الأشياء: التصميم، وكتابة التعليمات البرمجية، واستكشاف الأخطاء وإصلاحها، وغير ذلك الكثير. حاليًا، يمكنك فقط تفويض جزء من هذه المهام إلى نماذج الذكاء الاصطناعي في المرة الواحدة. ربما يمكنك أن تطلب من نموذج GPT-4 أن يكتب رمزًا للصفحة الرئيسية، ثم تطلب منه القيام بذلك لصفحة الاتصال، ثم لصفحة "حول"، وما إلى ذلك. ستحتاج إلى إكمال هذه المهام بشكل متكرر. وهناك مهام لا تستطيع النماذج إكمالها.

هذه العملية التكرارية المتمثلة في تحفيز نماذج الذكاء الاصطناعي لمهام فرعية محددة تستغرق وقتًا طويلاً وغير فعالة. في هذا السيناريو، أنت - مطور الويب - هي الوكيل البشري المسؤول عن تنسيق وتحفيز نماذج الذكاء الاصطناعي بمهمة واحدة في كل مرة حتى تكمل مجموعة كاملة من المهام ذات الصلة.

يعد وكلاء GPT بوجود روبوتات متخصصة يتم تنسيقها بواسطة GPT-5، كما نأمل، قادرة على الدفع الذاتي ومعالجة جميع المجموعات الفرعية لمهمة معقدة بشكل مستقل. التركيز على "التحفيز الذاتي" و"الاستقلال الذاتي".

لذا، إذا كان GPT-5 يأتي مع GPT Agents، فيمكنك أن تطلب منه "إنشاء موقع ويب لمحفظة أعمال Maxwell Timothy" بدلاً من مجرد "كتابة رمز لي للصفحة الرئيسية." ومن ثم سيكون GPT-5 قادرًا من الناحية النظرية على المطالبة الذاتية من خلال الاستعانة بوكلاء الذكاء الاصطناعي الخبراء للتعامل مع المهام الفرعية المختلفة اللازمة لإنشاء موقع ويب. قد يستدعي GPT واحدًا لإلغاء الويب للحصول على معلومات حول Maxwell Timothy، ووكيلًا آخر لكتابة التعليمات البرمجية لصفحات مختلفة، ووكيلًا آخر لإنشاء الصور وتحسينها، وحتى وكيلًا آخر للذكاء الاصطناعي لنشر الموقع، كل ذلك دون الحاجة إلى تدخل بشري متكرر. المطالبة.

4. هلوسة أقل

على الرغم من أن OpenAI قد قطعت شوطًا طويلًا في التعامل مع الهلوسة في نماذج الذكاء الاصطناعي الخاصة بها، إلا أن الاختبار الحقيقي لـ GPT-5 سيكون قدرته على معالجة المشكلة المستمرة المتمثلة في الهلوسة، والتي أعاقت اعتماد الذكاء الاصطناعي على نطاق واسع في المجالات عالية المخاطر والحساسة للسلامة مثل الرعاية الصحية والطيران والأمن السيبراني. هذه كلها مجالات من شأنها أن تستفيد بشكل كبير من المشاركة المكثفة للذكاء الاصطناعي ولكنها تتجنب حاليًا أي اعتماد كبير.

للتوضيح، تشير الهلوسة في هذا السياق إلى المواقف التي يقوم فيها نموذج الذكاء الاصطناعي بإنشاء وتقديم معلومات تبدو معقولة ولكنها ملفقة تمامًا بدرجة عالية من الثقة.

تخيل سيناريو يتم فيه دمج GPT-4 في نظام تشخيصي لتحليل أعراض المريض والتقارير الطبية. يمكن للهلوسة أن تدفع الذكاء الاصطناعي إلى تقديم تشخيص غير صحيح بثقة أو التوصية بدورة علاجية قد تكون خطيرة بناءً على حقائق متخيلة ومنطق زائف. عواقب مثل هذا الخطأ في المجال الطبي يمكن أن تكون كارثية.

تنطبق تحفظات مماثلة على مجالات أخرى ذات أهمية كبيرة، مثل الطيران والطاقة النووية والعمليات البحرية والأمن السيبراني. لا نتوقع أن يحل GPT-5 مشكلة الهلوسة بشكل كامل، لكننا نتوقع أن يقلل بشكل كبير من احتمالية وقوع مثل هذه الحوادث.

بينما ننتظر بفارغ الصبر الإصدار الرسمي لنموذج الذكاء الاصطناعي هذا الذي طال انتظاره، هناك شيء واحد مؤكد: GPT-5 لديه القدرة على إعادة تعريف حدود ما هو ممكن مع الذكاء الاصطناعي، إيذانا ببدء حقبة جديدة من البشر. -التعاون بين الآلات والابتكار.

بيان الافراج تم نشر هذه المقالة على: https://www.makeuseof.com/gpt-5-features-we-want-to-see/ إذا كان هناك أي انتهاك، يرجى الاتصال بـ [email protected] لحذفه
أحدث البرنامج التعليمي أكثر>

تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.

Copyright© 2022 湘ICP备2022001581号-3