يصل OpenAI o1 وo1-mini كأنظمة ذكاء اصطناعي تتعامل مع أسئلة العلوم والتكنولوجيا والهندسة والرياضيات بشكل أفضل من النماذج السابقة

الصفحة الأمامية > ملحقات التكنولوجيا > يصل OpenAI o1 وo1-mini كأنظمة ذكاء اصطناعي تتعامل مع أسئلة العلوم والتكنولوجيا والهندسة والرياضيات بشكل أفضل من النماذج السابقة

يصل OpenAI o1 وo1-mini كأنظمة ذكاء اصطناعي تتعامل مع أسئلة العلوم والتكنولوجيا والهندسة والرياضيات بشكل أفضل من النماذج السابقة

تم النشر بتاريخ 2024-10-31

تصفح:606

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

لقد وصل OpenAI o1 وo1-mini. تعمل برامج AI LLM هذه بشكل أفضل بكثير في حل مشكلات ومهام البرمجة والرياضيات والعلوم مقارنة بالنماذج السابقة مثل GPT-4o من خلال قضاء المزيد من الوقت في التفكير.

تميل المشكلات المعقدة في العلوم والتكنولوجيا والهندسة والرياضيات إلى أكثر من مجرد بحث سريع عبر الإنترنت للحصول على الإجابات الصحيحة. من خلال منح o1 AI مزيدًا من الوقت للتفكير، يستطيع الذكاء الاصطناعي التفكير بعناية ودقة أكبر. تم ضبط نموذج o1-mini خصيصًا للإجابة على أسئلة العلوم والتكنولوجيا والهندسة والرياضيات (STEM) بسرعة أكبر وطلب أقل على موارد الكمبيوتر، وهو أفضل بشكل ملحوظ في البرمجة من نموذج o1.

عبر مجموعة من اختبارات AP الموحدة واختبارات العلوم والتكنولوجيا والهندسة والرياضيات (STEM) لطلبة LLM، تعمل نماذج o1 بدقة عالية. على وجه التحديد، في اختبارات القراءة والكتابة المبنية على الأدلة AP Calculus وAP Chemistry وAP Physics 2 وLSAT وSAT، يكون أداء نماذج o1 عند مستوى الدرجة B أو أعلى (حوالي 80% أو أعلى). تجيب النماذج بدقة على مستوى الدرجة A على أسئلة الفيزياء على مستوى الدكتوراه، وعلى مستوى الدرجة B على أسئلة الرياضيات الصعبة لامتحان الرياضيات الأمريكية الدعوية لعام 2024، وعلى مستوى الدرجة B العالية على مشكلات ترميز Codeforces. نظرًا لأنه تم ضبط o1 للإجابة على أسئلة العلوم والتكنولوجيا والهندسة والرياضيات، فإن أدائه في AP English Language وAP English Literature يكون عند مستوى الصف C أو أقل منه.

&&&] ومن المثير للاهتمام، في حين أن GPT-4o مذهول من التحدي التشفيري المتمثل في فك تشفير "oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz" عندما يتم إعطاء التلميح "oyfjdnisdr rtqwainr acxz mynzbhhx" يعني "فكر خطوة بخطوة"، لم يكن لدى o1 أي مشاكل التفكير في المشكلة للتوصل إلى الإجابة الصحيحة "هناك ثلاثة حرف R في الفراولة". ستسعد هذه القوة الجديدة مصممي التشفير الهواة في المنزل وكذلك وكالة الأمن القومي.

سوف يرغب الأشرار في خزانة الملابس في معرفة أنه في حين أن نماذج o1 غير الخاضعة للرقابة قادرة على تقديم ردود مثيرة للقلق، فقد قامت OpenAI بتحييد هذه النماذج لإصدارها. تم اختبار نماذج o1 لمقاومة الإجابة على الأسئلة المتعلقة بصنع الأسلحة البيولوجية، وإنتاج صور بذيئة، وكسر الحماية نفسها، والمضايقة والتهديد. ولسوء الحظ، تظل نماذج OpenAI o1 متحيزة للجنس والعرق عند اختبارها، على الرغم من جهود الضبط.

يمكن لمستخدمي ChatGPT Plus وTeam بالإضافة إلى مطوري واجهة برمجة التطبيقات من المستوى 5 الوصول إلى نماذج o1 على الفور، وسيتمكن مستخدمو ChatGPT Edu وEnterprise من الوصول في الأسبوع الذي يبدأ في 16 سبتمبر. سيتمكن مستخدمو ChatGPT Free من الوصول إلى o1- ميني في المستقبل القريب. لا تستطيع نماذج o1 تصفح الويب أو قبول الملفات والصور التي تم تحميلها للإجابة على الأسئلة، لذلك توصي OpenAI المستخدمين بمواصلة استخدام نماذج GPT-4o الخاصة بهم للأسئلة العامة.

أصبح لدى المستخدمين الذين يرغبون في طرح أسئلة حول الذكاء الاصطناعي الآن مجموعة واسعة من نماذج LLM القادرة على التفاعل معها إلى جانب نماذج OpenAI، بما في ذلك Anthropic Claude، وMicrosoft CoPilot، وGoogle Gemini، وX Grok. يتمتع كل ذكاء اصطناعي بمزايا محددة، لذا من المفيد اختبار العديد من نماذج الذكاء الاصطناعي للعثور على النموذج الذي يناسب الاحتياجات الفردية. تم دمج بعض هذه الذكاء الاصطناعي في النظارات الذكية (مثل تلك الموجودة على أمازون) ومسجلات الصوت (مثل هذه الموجودة على أمازون)، وبعض الروبوتات البشرية المستقلة القادمة تستخدم الذكاء الاصطناعي الخاص للطهي والتنظيف. &&&]

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

بيان الافراج تم إعادة إنتاج هذه المقالة على: https://www.notebookcheck.net/OpenAI-o1-and-o1-mini-arrive-AI-that-reason-better-on-STEM-questions-than-prior-models.889335.0. html كما في حالة وجود أي انتهاك، يرجى الاتصال بـ [email protected] لحذفه.

أحدث البرنامج التعليمي أكثر>

iOS 18.3 الميزات: كل شيء جديد في iOS 18.3
iOS 18.3 هو التحديث الرئيسي الثالث لنظام التشغيل iOS 18 ، وعلى الرغم من أنه ليس ميزة غنية مثل iOS 18.1 أو iOS 18.2 ، هناك بعض التغييرات في ذكاء Apple...

ملحقات التكنولوجيا نشر في 2025-03-23
Intel Core Ultra 7 258V Beats Amd Ryzen Z1 Extreme في معيار اللعبة
تشكيلة بحيرة Intel Lunar Lake تتميز بـ XE2 LPG IGPU ، وتقول الشركة إن القوس 140V الموجود في بعض وحدات المعالجة المركزية الراقية هي "أفضل وحدة...

ملحقات التكنولوجيا نشر في 2025-03-22
$إن مواصفات Infinix Zero Flip \ التي تم تسريبها وتكشف عن أوجه تشابه مذهلة مع أحدث هاتف Flip Tecno$
إن مواصفات Infinix Zero Flip \ التي تم تسريبها وتكشف عن أوجه تشابه مذهلة مع أحدث هاتف Flip Tecno
من المتوقع أن تعلن Infinix عن أول هاتف ذكي قابلة للطي قريبًا ، وقبل إطلاقه ، ظهرت على الهاتف ومواصفاتها ، والتي تسمى Infinix Zero Flip ، عبر الإنت...

ملحقات التكنولوجيا نشر في 2025-02-25
كل ما تحتاج لمعرفته عن ذكاء Apple
Apple Intelligence هو ما تسميه شركة Apple مجموعة ميزات الذكاء الاصطناعي ، والتي تم عرضها في WWDC في يونيو 2024. لقد خططت Apple. ميزات الذكاء الم...

ملحقات التكنولوجيا نشر في 2025-02-23
يكشف Lenovo عن خيار لون جديد لجهاز 2024 Legion Y700 Gaming Tablet
يستعد Lenovo لبدء تشغيل 2024 Legion Y700 في 29 سبتمبر في الصين. سيواجه جهاز Android Gaming Tablet الجديد هذا Redmagic Nova ، وقد أكدت الشركة بالفع...

ملحقات التكنولوجيا نشر في 2025-02-07
INZONE M9 II: سوني تطلق شاشة ألعاب جديدة "مثالية لجهاز PS5" بدقة 4K وذروة سطوع تصل إلى 750 شمعة في المتر المربع
يصل INZONE M9 II كخليفة مباشر لـ INZONE M9، الذي يبلغ عمره الآن ما يزيد قليلاً عن عامين. بالمناسبة، قدمت سوني أيضًا INZONE M10S اليوم، والذي قمنا ...

ملحقات التكنولوجيا تم النشر بتاريخ 2024-12-21
تؤكد شركة Acer موعد الإعلان عن أجهزة الكمبيوتر المحمولة Intel Lunar Lake
في الشهر الماضي، أكدت شركة إنتل أنها ستطلق سلسلة شرائح Core Ultra 200 الجديدة في الثالث من سبتمبر. أعلنت شركة Acer الآن أنها ستعقد حدث Next@Acer ف...

ملحقات التكنولوجيا تم النشر بتاريخ 2024-12-21
من المتوقع إطلاق AMD Ryzen 7 9800X3D في أكتوبر؛ Ryzen 9 9950X3D و Ryzen 9 9900X3D سيظهران لأول مرة في العام المقبل
في العام الماضي، أطلقت AMD Ryzen 9 7950X3D وRyzen 9 7900X3D قبل Ryzen 7 7800X3D، والذي انخفض بعد أسبوعين. منذ ذلك الحين، رأينا مجموعة من وحدات SKU...

ملحقات التكنولوجيا تم النشر بتاريخ 2024-12-10
يقدم Steam لعبة مستقلة تحظى بشعبية كبيرة، ولكن اليوم فقط
اضغط على أي زر هي لعبة أركيد مستقلة تم تطويرها بواسطة المطور الفردي يوجين زوبكو وتم إصدارها في عام 2021. تدور القصة حول A-Eye - وهو ذكاء اصطناعي...

ملحقات التكنولوجيا تم النشر بتاريخ 2024-11-26
تم إلغاء معاينات Assassin's Creed Shadows مع تراجع Ubisoft عن معرض Tokyo Game Show 2024
في وقت سابق من اليوم، ألغت Ubisoft ظهورها عبر الإنترنت في معرض طوكيو للألعاب بسبب "ظروف مختلفة". تم تأكيد هذا الإعلان عبر تغريدة/منشور رس...

ملحقات التكنولوجيا تم النشر بتاريخ 2024-11-25
سعر لعبة سوني البالغة من العمر 7 سنوات يتضاعف فجأة
يتم إطلاق جهاز PlayStation 5 Pro بسعر أساسي قدره 700 دولار، مع وصول الحزمة الكاملة، بما في ذلك المحرك والحامل، إلى 850 دولارًا. وبينما تزعم شركة س...

ملحقات التكنولوجيا تم النشر بتاريخ 2024-11-22
صفقة | الكمبيوتر المحمول للألعاب Beastly MSI Raider GE78 HX مع RTX 4080 وCore i9 و32GB DDR5 معروض للبيع
بالنسبة للاعبين الذين يستخدمون الكمبيوتر المحمول المخصص للألعاب بشكل أساسي كبديل لسطح المكتب، قد يكون الكمبيوتر المحمول الكبير مثل MSI Raider GE78...

ملحقات التكنولوجيا تم النشر بتاريخ 2024-11-20
تكشف شركة Teenage Engineering النقاب عن EP-1320 Medieval الملتوي كأول "أداة إلكترونية" في العصور الوسطى في العالم
إن شركة Teenage Engineering هي شركة تسير على إيقاع عازف طبول مختلف تمامًا ليس سراً - إنها في الواقع ما يجذب العديد من معجبيها. ما لم يتوقعه هؤلاء ...

ملحقات التكنولوجيا تم النشر بتاريخ 2024-11-19
تحصل صور Google على إعدادات مسبقة مدعومة بالذكاء الاصطناعي وأدوات تحرير جديدة
تلقت ميزات تحرير الفيديو الموجودة في صور Google للتو مجموعة من الميزات المدعومة بالذكاء الاصطناعي، وستعمل هذه التغييرات على تحسين تجربة المستخدم ل...

ملحقات التكنولوجيا تم النشر بتاريخ 2024-11-19
يتم إطلاق مقل العيون Tecno Pop 9 5G بمظهر iPhone 16 ومواصفات الميزانية
أكدت شركة Tecno أنها ستتخلى عن المظهر الهندسي لهاتف Pop 8 من أجل كاميرا مرتفعة مستوحاة ظاهريًا من هاتفي Phone16 و16 Plus الجديدين في خليفته. &&& م...

ملحقات التكنولوجيا تم النشر بتاريخ 2024-11-19