"إذا أراد العامل أن يؤدي عمله بشكل جيد، فعليه أولاً أن يشحذ أدواته." - كونفوشيوس، "مختارات كونفوشيوس. لو لينجونج"
الصفحة الأمامية > ملحقات التكنولوجيا > يصل OpenAI o1 وo1-mini كأنظمة ذكاء اصطناعي تتعامل مع أسئلة العلوم والتكنولوجيا والهندسة والرياضيات بشكل أفضل من النماذج السابقة

يصل OpenAI o1 وo1-mini كأنظمة ذكاء اصطناعي تتعامل مع أسئلة العلوم والتكنولوجيا والهندسة والرياضيات بشكل أفضل من النماذج السابقة

تم النشر بتاريخ 2024-10-31
تصفح:606

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

لقد وصل OpenAI o1 وo1-mini. تعمل برامج AI LLM هذه بشكل أفضل بكثير في حل مشكلات ومهام البرمجة والرياضيات والعلوم مقارنة بالنماذج السابقة مثل GPT-4o من خلال قضاء المزيد من الوقت في التفكير.

تميل المشكلات المعقدة في العلوم والتكنولوجيا والهندسة والرياضيات إلى أكثر من مجرد بحث سريع عبر الإنترنت للحصول على الإجابات الصحيحة. من خلال منح o1 AI مزيدًا من الوقت للتفكير، يستطيع الذكاء الاصطناعي التفكير بعناية ودقة أكبر. تم ضبط نموذج o1-mini خصيصًا للإجابة على أسئلة العلوم والتكنولوجيا والهندسة والرياضيات (STEM) بسرعة أكبر وطلب أقل على موارد الكمبيوتر، وهو أفضل بشكل ملحوظ في البرمجة من نموذج o1.

عبر مجموعة من اختبارات AP الموحدة واختبارات العلوم والتكنولوجيا والهندسة والرياضيات (STEM) لطلبة LLM، تعمل نماذج o1 بدقة عالية. على وجه التحديد، في اختبارات القراءة والكتابة المبنية على الأدلة AP Calculus وAP Chemistry وAP Physics 2 وLSAT وSAT، يكون أداء نماذج o1 عند مستوى الدرجة B أو أعلى (حوالي 80% أو أعلى). تجيب النماذج بدقة على مستوى الدرجة A على أسئلة الفيزياء على مستوى الدكتوراه، وعلى مستوى الدرجة B على أسئلة الرياضيات الصعبة لامتحان الرياضيات الأمريكية الدعوية لعام 2024، وعلى مستوى الدرجة B العالية على مشكلات ترميز Codeforces. نظرًا لأنه تم ضبط o1 للإجابة على أسئلة العلوم والتكنولوجيا والهندسة والرياضيات، فإن أدائه في AP English Language وAP English Literature يكون عند مستوى الصف C أو أقل منه.

&&&] ومن المثير للاهتمام، في حين أن GPT-4o مذهول من التحدي التشفيري المتمثل في فك تشفير "oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz" عندما يتم إعطاء التلميح "oyfjdnisdr rtqwainr acxz mynzbhhx" يعني "فكر خطوة بخطوة"، لم يكن لدى o1 أي مشاكل التفكير في المشكلة للتوصل إلى الإجابة الصحيحة "هناك ثلاثة حرف R في الفراولة". ستسعد هذه القوة الجديدة مصممي التشفير الهواة في المنزل وكذلك وكالة الأمن القومي.

سوف يرغب الأشرار في خزانة الملابس في معرفة أنه في حين أن نماذج o1 غير الخاضعة للرقابة قادرة على تقديم ردود مثيرة للقلق، فقد قامت OpenAI بتحييد هذه النماذج لإصدارها. تم اختبار نماذج o1 لمقاومة الإجابة على الأسئلة المتعلقة بصنع الأسلحة البيولوجية، وإنتاج صور بذيئة، وكسر الحماية نفسها، والمضايقة والتهديد. ولسوء الحظ، تظل نماذج OpenAI o1 متحيزة للجنس والعرق عند اختبارها، على الرغم من جهود الضبط.

يمكن لمستخدمي ChatGPT Plus وTeam بالإضافة إلى مطوري واجهة برمجة التطبيقات من المستوى 5 الوصول إلى نماذج o1 على الفور، وسيتمكن مستخدمو ChatGPT Edu وEnterprise من الوصول في الأسبوع الذي يبدأ في 16 سبتمبر. سيتمكن مستخدمو ChatGPT Free من الوصول إلى o1- ميني في المستقبل القريب. لا تستطيع نماذج o1 تصفح الويب أو قبول الملفات والصور التي تم تحميلها للإجابة على الأسئلة، لذلك توصي OpenAI المستخدمين بمواصلة استخدام نماذج GPT-4o الخاصة بهم للأسئلة العامة.

أصبح لدى المستخدمين الذين يرغبون في طرح أسئلة حول الذكاء الاصطناعي الآن مجموعة واسعة من نماذج LLM القادرة على التفاعل معها إلى جانب نماذج OpenAI، بما في ذلك Anthropic Claude، وMicrosoft CoPilot، وGoogle Gemini، وX Grok. يتمتع كل ذكاء اصطناعي بمزايا محددة، لذا من المفيد اختبار العديد من نماذج الذكاء الاصطناعي للعثور على النموذج الذي يناسب الاحتياجات الفردية. تم دمج بعض هذه الذكاء الاصطناعي في النظارات الذكية (مثل تلك الموجودة على أمازون) ومسجلات الصوت (مثل هذه الموجودة على أمازون)، وبعض الروبوتات البشرية المستقلة القادمة تستخدم الذكاء الاصطناعي الخاص للطهي والتنظيف. &&&]

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

بيان الافراج تم إعادة إنتاج هذه المقالة على: https://www.notebookcheck.net/OpenAI-o1-and-o1-mini-arrive-AI-that-reason-better-on-STEM-questions-than-prior-models.889335.0. html كما في حالة وجود أي انتهاك، يرجى الاتصال بـ [email protected] لحذفه.
أحدث البرنامج التعليمي أكثر>

تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.

Copyright© 2022 湘ICP备2022001581号-3