«Если рабочий хочет хорошо выполнять свою работу, он должен сначала заточить свои инструменты» — Конфуций, «Аналитики Конфуция. Лу Лингун»
титульная страница > Технологическая периферия > OpenAI o1 и o1-mini представляют собой ИИ, которые лучше справляются с вопросами STEM, чем предыдущие модели.

OpenAI o1 и o1-mini представляют собой ИИ, которые лучше справляются с вопросами STEM, чем предыдущие модели.

Опубликовано 31 октября 2024 г.
Просматривать:602

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

Поступили OpenAI o1 и o1-mini. Эти AI LLM намного лучше справляются с проблемами и задачами в области кодирования, математики и естественных наук, чем предыдущие модели, такие как GPT-4o, поскольку им требуется больше времени на размышления.

Сложные проблемы в STEM, как правило, требуют большего, чем просто быстрый поиск правильных ответов в Интернете. Давая ИИ o1 больше времени на размышление, ИИ может рассуждать более тщательно и точно. Модель o1-mini была специально настроена для ответа на вопросы STEM с более высокой скоростью и меньшими требованиями к компьютерным ресурсам, и она заметно лучше справляется с кодированием, чем модель o1.

Модели o1 работают с высокой точностью при сдаче различных стандартизированных экзаменов AP и тестов STEM для студентов LLM. В частности, в тестах по чтению и письму AP Calculus, AP Chemistry, AP Physics 2, LSAT и SAT модели o1 работают на уровне B-оценки или выше (~ 80 % или выше). Модели дают точные ответы на уровне A на вопросы по физике на уровне PhD, на уровне B на сложные математические вопросы Американского приглашенного экзамена по математике 2024 года и на высоком уровне B на задачах кодирования Codeforces. Поскольку o1 был настроен для ответов на вопросы STEM, его результаты по AP English Language и AP English Literature находятся на уровне C или ниже.

Интересно, что хотя GPT-4o ошарашен криптографической проблемой декодирования «oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz», когда ему дали подсказку «oyfjdnisdr rtqwainr acxz mynzbhhx» означает «Думай шаг за шагом», у o1 не было проблем продумывая задачу, найти правильный ответ: «В клубнике три буквы р». Эта новая возможность порадует любителей криптографии как дома, так и в АНБ.

Скрытые злодеи захотят знать, что, хотя модели o1 без цензуры склонны давать тревожные ответы, OpenAI нейтрализовал эти модели для выпуска. Модели o1 были протестированы на то, чтобы не отвечать на вопросы о создании биологического оружия, создании непристойных изображений, взломе самой тюрьмы, а также преследовании и угрозах. К сожалению, модели OpenAI o1 по-прежнему имеют гендерную и расовую предвзятость при тестировании, несмотря на усилия по настройке.

Пользователи ChatGPT Plus и Team вместе с разработчиками уровня 5 использования API сразу же получают доступ к моделям o1, а пользователи ChatGPT Edu и Enterprise получат доступ 16 сентября. Пользователи ChatGPT Free получат доступ к o1- мини в ближайшем будущем. Модели o1 не могут просматривать веб-страницы или принимать загруженные файлы и изображения для ответа на вопросы, поэтому OpenAI рекомендует пользователям продолжать использовать модели GPT-4o для ответов на общие вопросы.

Пользователи, которые хотят задавать вопросы об ИИ, теперь имеют широкий спектр функциональных моделей LLM для взаимодействия, помимо моделей OpenAI, включая Anthropic Claude, Microsoft CoPilot, Google Gemini и X Grok. У каждого ИИ есть определенные преимущества, поэтому стоит протестировать несколько моделей ИИ, чтобы найти ту, которая лучше всего соответствует индивидуальным потребностям. Некоторые из этих ИИ встроены в умные очки (например, на Amazon) и диктофоны (например, на Amazon), а некоторые будущие автономные роботы-гуманоиды будут использовать запатентованный ИИ для приготовления пищи и уборки.

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

Заявление о выпуске Эта статья воспроизведена по адресу: https://www.notebookcheck.net/OpenAI-o1-and-o1-mini-arrive-AI-that-reason-better-on-STEM-questions-than-prior-models.889335.0. html как Если есть какие-либо нарушения, свяжитесь с [email protected], чтобы удалить их.
Последний учебник Более>

Изучайте китайский

Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.

Copyright© 2022 湘ICP备2022001581号-3