OpenAI o1 и o1-mini представляют собой ИИ, которые лучше справляются с вопросами STEM, чем предыдущие модели.

титульная страница > Технологическая периферия > OpenAI o1 и o1-mini представляют собой ИИ, которые лучше справляются с вопросами STEM, чем предыдущие модели.

OpenAI o1 и o1-mini представляют собой ИИ, которые лучше справляются с вопросами STEM, чем предыдущие модели.

Опубликовано 31 октября 2024 г.

Просматривать:602

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

Поступили OpenAI o1 и o1-mini. Эти AI LLM намного лучше справляются с проблемами и задачами в области кодирования, математики и естественных наук, чем предыдущие модели, такие как GPT-4o, поскольку им требуется больше времени на размышления.

Сложные проблемы в STEM, как правило, требуют большего, чем просто быстрый поиск правильных ответов в Интернете. Давая ИИ o1 больше времени на размышление, ИИ может рассуждать более тщательно и точно. Модель o1-mini была специально настроена для ответа на вопросы STEM с более высокой скоростью и меньшими требованиями к компьютерным ресурсам, и она заметно лучше справляется с кодированием, чем модель o1.

Модели o1 работают с высокой точностью при сдаче различных стандартизированных экзаменов AP и тестов STEM для студентов LLM. В частности, в тестах по чтению и письму AP Calculus, AP Chemistry, AP Physics 2, LSAT и SAT модели o1 работают на уровне B-оценки или выше (~ 80 % или выше). Модели дают точные ответы на уровне A на вопросы по физике на уровне PhD, на уровне B на сложные математические вопросы Американского приглашенного экзамена по математике 2024 года и на высоком уровне B на задачах кодирования Codeforces. Поскольку o1 был настроен для ответов на вопросы STEM, его результаты по AP English Language и AP English Literature находятся на уровне C или ниже.

Интересно, что хотя GPT-4o ошарашен криптографической проблемой декодирования «oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz», когда ему дали подсказку «oyfjdnisdr rtqwainr acxz mynzbhhx» означает «Думай шаг за шагом», у o1 не было проблем продумывая задачу, найти правильный ответ: «В клубнике три буквы р». Эта новая возможность порадует любителей криптографии как дома, так и в АНБ.

Скрытые злодеи захотят знать, что, хотя модели o1 без цензуры склонны давать тревожные ответы, OpenAI нейтрализовал эти модели для выпуска. Модели o1 были протестированы на то, чтобы не отвечать на вопросы о создании биологического оружия, создании непристойных изображений, взломе самой тюрьмы, а также преследовании и угрозах. К сожалению, модели OpenAI o1 по-прежнему имеют гендерную и расовую предвзятость при тестировании, несмотря на усилия по настройке.

Пользователи ChatGPT Plus и Team вместе с разработчиками уровня 5 использования API сразу же получают доступ к моделям o1, а пользователи ChatGPT Edu и Enterprise получат доступ 16 сентября. Пользователи ChatGPT Free получат доступ к o1- мини в ближайшем будущем. Модели o1 не могут просматривать веб-страницы или принимать загруженные файлы и изображения для ответа на вопросы, поэтому OpenAI рекомендует пользователям продолжать использовать модели GPT-4o для ответов на общие вопросы.

Пользователи, которые хотят задавать вопросы об ИИ, теперь имеют широкий спектр функциональных моделей LLM для взаимодействия, помимо моделей OpenAI, включая Anthropic Claude, Microsoft CoPilot, Google Gemini и X Grok. У каждого ИИ есть определенные преимущества, поэтому стоит протестировать несколько моделей ИИ, чтобы найти ту, которая лучше всего соответствует индивидуальным потребностям. Некоторые из этих ИИ встроены в умные очки (например, на Amazon) и диктофоны (например, на Amazon), а некоторые будущие автономные роботы-гуманоиды будут использовать запатентованный ИИ для приготовления пищи и уборки.

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

Заявление о выпуске Эта статья воспроизведена по адресу: https://www.notebookcheck.net/OpenAI-o1-and-o1-mini-arrive-AI-that-reason-better-on-STEM-questions-than-prior-models.889335.0. html как Если есть какие-либо нарушения, свяжитесь с [email protected], чтобы удалить их.

Последний учебник Более>

iOS 18.3 Особенности: все новое в iOS 18.3
ios 18.3 является третьим основным обновлением операционной системы iOS 18, и, хотя она не такая функция, богатая, как ios 18.1 или ios 18.2, есть не...

Технологическая периферия Опубликовано в 2025-03-23
Intel Core Ultra 7 258V Beats Amd Ryzen Z1 Extreme в игровом этаже
intel Lunar Lake Line Offices xe2 LPG IGPU, и компания говорит, что ARC 140V, которая находится в некоторых из более высоких процессов, является «...

Технологическая периферия Опубликовано в 2025-03-22
Протешенные характеристики и рендеры Infinix Zero Flip показывают поразительное сходство с последним перевернутым телефоном Tecno
] Infinix, как ожидается, скоро объявит о своем первом складном смартфоне, и в преддверии его запуска, рендеринг и спецификации телефона, называемы...

Технологическая периферия Опубликовано в 2025-02-25
Все, что вам нужно знать о интеллекте Apple
Apple Intelligence - это то, что Apple называет своим набором функций искусственного интеллекта, предварительно просмотрено на WWDC в июне 2024 года....

Технологическая периферия Опубликовано в 2025-02-23
Lenovo раскрывает новый вариант цвета для игрового планшета Legion Y700 2024
Lenovo готовится запустить Legion 2024 Y700 29 сентября в Китае. Этот новый планшет Android Gaming будет идти против Redmagic Nova, и компания уже...

Технологическая периферия Опубликовано в 2025-02-07
INZONE M9 II: Sony выпускает новый игровой монитор, «идеально подходящий для PS5» с разрешением 4K и пиковой яркостью 750 нит
INZONE M9 II является прямым преемником INZONE M9, которому сейчас чуть больше двух лет. Кстати, Sony сегодня также представила INZONE M10S, о котором...

Технологическая периферия Опубликовано 21 декабря 2024 г.
Acer подтверждает дату анонса своих ноутбуков Intel Lunar Lake
В прошлом месяце Intel подтвердила, что выпустит новые чипы серии Core Ultra 200 3 сентября. Acer объявила, что проведет мероприятие Next@Acer 4 сентя...

Технологическая периферия Опубликовано 21 декабря 2024 г.
AMD Ryzen 7 9800X3D выйдет в октябре; Ryzen 9 9950X3D и Ryzen 9 9900X3D дебютируют в следующем году
В прошлом году AMD выпустила Ryzen 9 7950X3D и Ryzen 9 7900X3D перед Ryzen 7 7800X3D, который вышел пару недель спустя. С тех пор мы видели множество ...

Технологическая периферия Опубликовано 10 декабря 2024 г.
Steam раздает очень популярную инди-игру, но только сегодня
Press Any Button — инди-аркадная игра, разработанная индивидуальным разработчиком Евгением Зубко и выпущенная в 2021 году. Сюжет разворачивается вокру...

Технологическая периферия Опубликовано 26 ноября 2024 г.
Сообщается, что превью Assassin’s Creed Shadows отменены, поскольку Ubisoft отказывается от участия в Tokyo Game Show 2024
Ранее сегодня Ubisoft отменила свое онлайн-выступление на Tokyo Game Show из-за «различных обстоятельств». Это объявление было подтверждено официальны...

Технологическая периферия Опубликовано 25 ноября 2024 г.
Цена на игру Sony семилетней давности внезапно выросла вдвое
Базовая цена PlayStation 5 Pro составляет 700 долларов США, а стоимость полного пакета, включая привод и подставку, достигает 850 долларов США. Хотя S...

Технологическая периферия Опубликовано 22 ноября 2024 г.
Сделка | Чудовищный игровой ноутбук MSI Raider GE78 HX с RTX 4080, Core i9 и 32 ГБ памяти DDR5 поступил в продажу
Для геймеров, которые в основном используют игровой ноутбук в качестве замены настольного компьютера, лучшим выбором может стать большой ноутбук, тако...

Технологическая периферия Опубликовано 20 ноября 2024 г.
Teenage Engineering представляет необычный EP-1320 Medieval как первый в мире средневековый «инструментальный электронный инструмент»
То, что Teenage Engineering – это компания, которая идет в такт совсем другому барабанщику, ни для кого не секрет – на самом деле именно это привлекае...

Технологическая периферия Опубликовано 19 ноября 2024 г.
Google Photos получает пресеты на базе искусственного интеллекта и новые инструменты редактирования
Функции редактирования видео, присутствующие в Google Фото, только что получили поддержку функций искусственного интеллекта, и эти изменения улучшат п...

Технологическая периферия Опубликовано 19 ноября 2024 г.
Выпущен Tecno Pop 9 5G с внешним видом в стиле iPhone 16 и бюджетными характеристиками
Tecno подтвердила, что откажется от геометрического внешнего вида Pop 8 в пользу приподнятого выступа камеры, якобы вдохновленного новым Phone 16 и ег...

Технологическая периферия Опубликовано 19 ноября 2024 г.