GPT-5: 4 ميزات جديدة نريد رؤيتها

الصفحة الأمامية > منظمة العفو الدولية > GPT-5: 4 ميزات جديدة نريد رؤيتها

GPT-5: 4 ميزات جديدة نريد رؤيتها

تم النشر بتاريخ 2024-08-17

تصفح:455

على الأقل هذا ما نأمله. لا يوجد تاريخ محدد لإطلاق GPT-5، ومعظم ما نعتقد أننا نعرفه يأتي من تجميع المعلومات الأخرى ومحاولة ربط النقاط.

ومع ذلك، بغض النظر عن تاريخ الاستحقاق، هناك بعض الميزات الرئيسية التي نريد رؤيتها عند إطلاق GPT-5.

ما هو GPT-5 الخاص بـ OpenAI؟

يعد GPT-5 هو الوريث المرتقب لنموذج GPT-4 AI الخاص بـ OpenAI، والذي من المتوقع على نطاق واسع أن يكون أقوى نموذج توليدي في السوق. على الرغم من أنه لا يوجد حاليًا تاريخ إصدار رسمي لـ GPT-5، إلا أن هناك دلائل تشير إلى أنه يمكن إصداره في وقت مبكر من صيف عام 2024. ولا يُعرف سوى القليل جدًا من التفاصيل حول النموذج في هذا الوقت، ولكن يمكن قول العديد من الأشياء بقدر من الثقة. اليقين:

قدمت OpenAI علامة تجارية للاسم لدى مكتب براءات الاختراع والعلامات التجارية بالولايات المتحدة. ناقش العديد من المديرين التنفيذيين في OpenAI أو ألمحوا إلى القدرات المحتملة للنموذج. ذكر سام ألتمان، الرئيس التنفيذي لشركة OpenAI، النموذج مرارًا وتكرارًا خلال مقابلة على اليوتيوب في مارس 2024 مع ليكس فريدمان.

تشير كل هذه الأمور إلى حقيقة واحدة مثيرة: GPT-5 قادم! ومع ذلك، فإن الكثير من الأشياء هي مجرد تكهنات في هذه المرحلة. ولكن هناك بعض الأشياء التي نأمل أن نراها ونحن واثقون إلى حد ما من رؤيتها في النموذج. فيما يلي بعض منها:

1. المزيد من الوسائط المتعددة

كانت تعدد الوسائط إحدى التحسينات الأكثر إثارة لمجموعة GPT من نماذج الذكاء الاصطناعي. من أجل الوضوح، تعدد الوسائط هو قدرة نموذج الذكاء الاصطناعي على معالجة أكثر من مجرد نص ولكن أيضًا أنواع أخرى من المدخلات مثل الصور والصوت والفيديو. ستكون تعدد الوسائط بمثابة معيار تقدم مهم لمجموعة نماذج GPT في المستقبل.

مع مهارة GPT-4 بالفعل في التعامل مع مدخلات ومخرجات الصور، تعد التحسينات التي تغطي معالجة الصوت والفيديو هي الإنجاز التالي لـ OpenAI، ويعد GPT-5 مكانًا جيدًا للبدء. تحرز Google بالفعل تقدمًا جديًا في هذا النوع من الوسائط المتعددة من خلال نموذج Gemini AI الخاص بها. سيكون من غير المعتاد أن لا تستجيب OpenAI. لكن، بالطبع، لا تأخذ كلمتنا على محمل الجد. في البودكاست الخاص به Unconfuse Me [نسخة PDF]، سأل بيل جيتس الرئيس التنفيذي لشركة OpenAI، سام ألتمان، عن المعالم الرئيسية التي يتوقعها لسلسلة GPT في العامين المقبلين. إجابته الأولى؟ معالجة الفيديو.

لذا، بالنسبة لـ GPT-5، نتوقع أن نكون قادرين على التعامل مع مقاطع الفيديو — تحميل مقاطع الفيديو كمطالبات، وإنشاء مقاطع فيديو أثناء التنقل، وتحرير مقاطع الفيديو باستخدام مطالبات نصية، واستخراج مقاطع من مقاطع الفيديو، والعثور على مشاهد محددة من ملفات الفيديو الكبيرة. نتوقع أن نكون قادرين على القيام بأشياء مماثلة للملفات الصوتية. إنه طلب كبير، نعم. ولكن بالنظر إلى مدى سرعة تطور الذكاء الاصطناعي، فهو توقع معقول جدًا.

2. نافذة سياق أكبر وأكثر كفاءة

على الرغم من كونها واحدة من نماذج الذكاء الاصطناعي الأكثر تطورًا في السوق، إلا أن عائلة GPT من نماذج الذكاء الاصطناعي لديها واحدة من أصغر نوافذ السياق. على سبيل المثال، يتميز Claude 3 من Anthropic بنافذة سياق مكونة من 200000 رمز مميز، بينما يمكن لـ Gemini من Google معالجة مليون رمز مذهل (128000 للاستخدام القياسي). في المقابل، يحتوي GPT-4 على نافذة سياق أصغر نسبيًا تبلغ 128000 رمزًا مميزًا، مع ما يقرب من 32000 رمزًا مميزًا أو أقل متاحة بشكل واقعي للاستخدام على واجهات مثل ChatGPT.

مع ظهور الوسائط المتعددة المتقدمة في الصورة، أصبح تحسين نافذة السياق أمرًا لا مفر منه تقريبًا. ربما تكون الزيادة بعامل اثنين أو أربعة كافية، لكننا نأمل أن نرى شيئًا مثل عامل العشرة. سيسمح هذا لـ GPT-5 بمعالجة المزيد من المعلومات بطريقة أكثر كفاءة. الآن، لا تعني نافذة السياق الأكبر دائمًا الأفضل. لذا، بدلاً من مجرد زيادة نافذة السياق، نود أن نرى زيادة في كفاءة معالجة السياق.

كما ترى، قد يحتوي النموذج على نافذة سياق مليون رمز مميز (سعة حوالي 700000 كلمة) ولكنه يفشل في إنتاج ملخص شامل عندما يُطلب منه تلخيص كتاب مكون من 500000 كلمة لأنه لا يمكنه معالجة الكتاب بالكامل بشكل مناسب للسياق على الرغم من وجود القدرة على القيام بذلك من الناحية النظرية. إن قدرتك على قراءة كتاب مكون من 500 ألف كلمة لا يعني أنه يمكنك تذكر كل شيء فيه أو معالجته بشكل معقول.

3. وكلاء GPT

ربما يكون أحد أكثر الاحتمالات إثارة لإصدار GPT-5 هو الظهور الأول لوكلاء GPT. في حين أنه من المحتمل أن يكون مصطلح "مغير قواعد اللعبة" قد تم الإفراط في استخدامه في الذكاء الاصطناعي، فإن عملاء GPT سيغيرون قواعد اللعبة بكل معنى الكلمة. ولكن إلى أي حد سيغير هذا قواعد اللعبة؟

حاليًا، يمكن لنماذج الذكاء الاصطناعي مثل GPT-4 مساعدتك في إكمال المهمة. يمكنهم كتابة بريد إلكتروني، أو فك نكتة، أو حل مسألة رياضية، أو صياغة مشاركة مدونة لك. ومع ذلك، يمكنهم فقط القيام بهذه المهمة المحددة ولا يمكنهم إكمال مجموعة من المهام ذات الصلة التي قد تكون ضرورية لإكمال عملك.

لنفترض أنك مطور ويب. كجزء من وظيفتك، يُتوقع منك القيام بالعديد من الأشياء: التصميم، وكتابة التعليمات البرمجية، واستكشاف الأخطاء وإصلاحها، وغير ذلك الكثير. حاليًا، يمكنك فقط تفويض جزء من هذه المهام إلى نماذج الذكاء الاصطناعي في المرة الواحدة. ربما يمكنك أن تطلب من نموذج GPT-4 أن يكتب رمزًا للصفحة الرئيسية، ثم تطلب منه القيام بذلك لصفحة الاتصال، ثم لصفحة "حول"، وما إلى ذلك. ستحتاج إلى إكمال هذه المهام بشكل متكرر. وهناك مهام لا تستطيع النماذج إكمالها.

هذه العملية التكرارية المتمثلة في تحفيز نماذج الذكاء الاصطناعي لمهام فرعية محددة تستغرق وقتًا طويلاً وغير فعالة. في هذا السيناريو، أنت - مطور الويب - هي الوكيل البشري المسؤول عن تنسيق وتحفيز نماذج الذكاء الاصطناعي بمهمة واحدة في كل مرة حتى تكمل مجموعة كاملة من المهام ذات الصلة.

يعد وكلاء GPT بوجود روبوتات متخصصة يتم تنسيقها بواسطة GPT-5، كما نأمل، قادرة على الدفع الذاتي ومعالجة جميع المجموعات الفرعية لمهمة معقدة بشكل مستقل. التركيز على "التحفيز الذاتي" و"الاستقلال الذاتي".

لذا، إذا كان GPT-5 يأتي مع GPT Agents، فيمكنك أن تطلب منه "إنشاء موقع ويب لمحفظة أعمال Maxwell Timothy" بدلاً من مجرد "كتابة رمز لي للصفحة الرئيسية." ومن ثم سيكون GPT-5 قادرًا من الناحية النظرية على المطالبة الذاتية من خلال الاستعانة بوكلاء الذكاء الاصطناعي الخبراء للتعامل مع المهام الفرعية المختلفة اللازمة لإنشاء موقع ويب. قد يستدعي GPT واحدًا لإلغاء الويب للحصول على معلومات حول Maxwell Timothy، ووكيلًا آخر لكتابة التعليمات البرمجية لصفحات مختلفة، ووكيلًا آخر لإنشاء الصور وتحسينها، وحتى وكيلًا آخر للذكاء الاصطناعي لنشر الموقع، كل ذلك دون الحاجة إلى تدخل بشري متكرر. المطالبة.

4. هلوسة أقل

على الرغم من أن OpenAI قد قطعت شوطًا طويلًا في التعامل مع الهلوسة في نماذج الذكاء الاصطناعي الخاصة بها، إلا أن الاختبار الحقيقي لـ GPT-5 سيكون قدرته على معالجة المشكلة المستمرة المتمثلة في الهلوسة، والتي أعاقت اعتماد الذكاء الاصطناعي على نطاق واسع في المجالات عالية المخاطر والحساسة للسلامة مثل الرعاية الصحية والطيران والأمن السيبراني. هذه كلها مجالات من شأنها أن تستفيد بشكل كبير من المشاركة المكثفة للذكاء الاصطناعي ولكنها تتجنب حاليًا أي اعتماد كبير.

للتوضيح، تشير الهلوسة في هذا السياق إلى المواقف التي يقوم فيها نموذج الذكاء الاصطناعي بإنشاء وتقديم معلومات تبدو معقولة ولكنها ملفقة تمامًا بدرجة عالية من الثقة.

تخيل سيناريو يتم فيه دمج GPT-4 في نظام تشخيصي لتحليل أعراض المريض والتقارير الطبية. يمكن للهلوسة أن تدفع الذكاء الاصطناعي إلى تقديم تشخيص غير صحيح بثقة أو التوصية بدورة علاجية قد تكون خطيرة بناءً على حقائق متخيلة ومنطق زائف. عواقب مثل هذا الخطأ في المجال الطبي يمكن أن تكون كارثية.

تنطبق تحفظات مماثلة على مجالات أخرى ذات أهمية كبيرة، مثل الطيران والطاقة النووية والعمليات البحرية والأمن السيبراني. لا نتوقع أن يحل GPT-5 مشكلة الهلوسة بشكل كامل، لكننا نتوقع أن يقلل بشكل كبير من احتمالية وقوع مثل هذه الحوادث.

بينما ننتظر بفارغ الصبر الإصدار الرسمي لنموذج الذكاء الاصطناعي هذا الذي طال انتظاره، هناك شيء واحد مؤكد: GPT-5 لديه القدرة على إعادة تعريف حدود ما هو ممكن مع الذكاء الاصطناعي، إيذانا ببدء حقبة جديدة من البشر. -التعاون بين الآلات والابتكار.

بيان الافراج تم نشر هذه المقالة على: https://www.makeuseof.com/gpt-5-features-we-want-to-see/ إذا كان هناك أي انتهاك، يرجى الاتصال بـ [email protected] لحذفه

أحدث البرنامج التعليمي أكثر>

8 توصيات واجهة برمجة تطبيقات حرة ودفع مدفوعة الأجر لـ LLM
تسخير قوة LLMS: دليل لواجهة برمجة التطبيقات لنماذج اللغة الكبيرة في مشهد الأعمال الديناميكي اليوم ، فإن واجهات برمجة التطبيقات (واجهات برمجة التطبي...

منظمة العفو الدولية نشر في 2025-04-21
دليل المستخدم: نموذج Falcon 3-7B
Tii's Falcon 3: قفزة ثورية في AI مفتوح المصدر يسعى السعي الطموح لـ Tii لإعادة تعريف الذكاء الاصطناعى إلى ارتفاعات جديدة مع طراز Falcon 3 المتقد...

منظمة العفو الدولية نشر في 2025-04-20
Deepseek-V3 مقابل GPT-4O و Llama 3.3 70B: تم الكشف عن أقوى نموذج منظمة العفو الدولية
The evolution of AI language models has set new standards, especially in the coding and programming landscape. Leading the c...

منظمة العفو الدولية نشر في 2025-04-18
أفضل 5 أدوات للميزانية الذكية من الذكاء الاصطناعي
فتح الحرية المالية مع الذكاء الاصطناعي: أفضل تطبيقات الميزانية في الهند هل سئمت من أن تتساءل باستمرار إلى أين تذهب أموالك؟ هل يبدو أن الفواتير تلت...

منظمة العفو الدولية نشر في 2025-04-17
شرح مفصل لوظيفة Excel Sumproduct - كلية تحليل البيانات
وظيفة Sumproduct الخاصة بـ Excel: A Data Analysis Powerhouse فتح قوة وظيفة Sumproduct الخاصة بـ Excel لتحليل البيانات المبسط. تجمع هذه الوظيفة متعد...

منظمة العفو الدولية نشر في 2025-04-16
البحث المتعمق مفتوح بالكامل ، فوائد chatgpt plus للمستخدم
أبحاث Openai العميقة: مغير لعبة لأبحاث الذكاء الاصطناعي أطلقت Openai البحث العميق لجميع المشتركين في ChatGPT Plus ، مما يعد بزيادة كبيرة في كفاءة ا...

منظمة العفو الدولية نشر في 2025-04-16
Amazon Nova اليوم تجربة ومراجعة حقيقية - تحليلات Vidhya
تكشف Amazon عن نوفا: نماذج الأساس المتطورة لإنشاء الذكاء الاصطناعى المحسّن وإنشاء المحتوى يعرض حدث Amazon's الأخير: Invent 2024 Nova ، وهو أكثر...

منظمة العفو الدولية نشر في 2025-04-16
5 طرق لاستخدام وظيفة مهمة توقيت ChatGPT
المهام المجدولة الجديدة لـ ChatGpt: أتمتة يومك باستخدام AI قدمت ChatGPT مؤخرًا ميزة تغيير اللعبة: المهام المجدولة. يتيح ذلك للمستخدمين أتمتة المطا...

منظمة العفو الدولية نشر في 2025-04-16
أي من الدردشة الثلاثة من الذكاء الاصطناعي يستجيب لنفس المطالبة هو الأفضل؟
مع خيارات مثل Claude و Chatgpt و Gemini ، يمكن أن يشعر chatbot بالسحر. للمساعدة في التغلب على الضوضاء ، وضعت الثلاثة على الاختبار باستخدام مطالبة ...

منظمة العفو الدولية نشر في 2025-04-15
chatgpt يكفي ، لا يلزم وجود آلة دردشة منظمة العفو الدولية
في عالم مع إطلاق دردشة منظمة العفو الدولية الجديدة يوميًا ، قد يكون من الساحق أن تقرر أي واحد هو "واحد". ولكن في تجربتي ، يتعامل Chatgpt إل...

منظمة العفو الدولية نشر في 2025-04-14
لحظة منظمة العفو الدولية الهندية: المنافسة مع الصين والولايات المتحدة في الذكاء الاصطناعي
طموحات منظمة العفو الدولية في الهند: تحديث 2025 مع الاستثمار الصيني والولايات المتحدة بشكل كبير في الذكاء الاصطناعى التوليدي ، تقوم الهند بتسريع مب...

منظمة العفو الدولية نشر في 2025-04-13
أتمتة استيراد CSV إلى postgreSQL باستخدام تدفق الهواء و Docker
يوضح هذا البرنامج التعليمي إنشاء خط أنابيب قوي للبيانات باستخدام تدفق Apache Airflow و Docker و PostgreSQL لأتمتة نقل البيانات من ملفات CSV إلى قاعدة...

منظمة العفو الدولية نشر في 2025-04-12
خوارزميات ذكاء سرب: ثلاثة تطبيقات بيثون
Imagine watching a flock of birds in flight. There's no leader, no one giving directions, yet they swoop and glide together in perfect harmony. It may...

منظمة العفو الدولية نشر في 2025-03-24
كيف تجعل LLM أكثر دقة مع RAG & TUNING
Imagine studying a module at university for a semester. At the end, after an intensive learning phase, you take an exam – and you can recall th...

منظمة العفو الدولية نشر في 2025-03-24
ما هو Google Gemini؟ كل ما تحتاج لمعرفته حول منافس جوجل chatgpt
Google recently released its new Generative AI model, Gemini. It results from a collaborative effort by a range of teams at Google, including members ...

منظمة العفو الدولية نشر في 2025-03-23