OpenAI o1 y o1-mini llegan como IA que manejan las preguntas STEM mejor que los modelos anteriores

Página delantera > Periféricos tecnológicos > OpenAI o1 y o1-mini llegan como IA que manejan las preguntas STEM mejor que los modelos anteriores

OpenAI o1 y o1-mini llegan como IA que manejan las preguntas STEM mejor que los modelos anteriores

Publicado el 2024-10-31

Navegar:980

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 y o1-mini han llegado. Estos LLM de IA funcionan mucho mejor en tareas y problemas de codificación, matemáticas y ciencias que los modelos anteriores, como GPT-4o, al tomar más tiempo para pensar.

Los problemas complejos en STEM tienden a requerir más que una búsqueda rápida en línea de las respuestas correctas. Al darle a la IA o1 más tiempo para pensar, la IA puede razonar con más cuidado y precisión. El modelo o1-mini ha sido ajustado específicamente para responder preguntas STEM con mayor velocidad y menor demanda de recursos informáticos, y es notablemente mejor en codificación que el modelo o1.

En una variedad de exámenes AP estandarizados y pruebas STEM para LLM, los modelos o1 funcionan con alta precisión. Específicamente, en las pruebas de lectura y escritura basadas en evidencia AP Cálculo, AP Química, AP Física 2, LSAT y SAT, los modelos o1 se desempeñan en o por encima del nivel de grado B (~80% o más). Los modelos responden con precisión en el nivel de grado A en preguntas de física de nivel de doctorado, en el nivel de grado B en preguntas difíciles de matemáticas del American Invitational Mathematics Examination de 2024 y en el nivel de grado B alto en problemas de codificación de Codeforces. Debido a que o1 ha sido optimizado para responder preguntas STEM, su desempeño en Lengua Inglesa AP y Literatura Inglesa AP está en o por debajo del nivel de grado C.

Curiosamente, mientras GPT-4o está estupefacto por el desafío criptográfico de decodificar “oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz” cuando se le da la pista “oyfjdnisdr rtqwainr acxz mynzbhhx” significa “Piensa paso a paso”, o1 no tuvo problemas Pensar en el problema para llegar a la respuesta correcta "Hay tres R en la fresa". Este nuevo poder hará las delicias de los criptógrafos aficionados en casa, así como de la NSA.

Los malhechores del armario querrán saber que, si bien los modelos o1 sin censura pueden dar respuestas preocupantes, OpenAI los ha castrado para su publicación. Los modelos o1 han sido probados para resistirse a responder preguntas sobre la fabricación de armas biológicas, la producción de imágenes atrevidas, el jailbreak y el acoso y las amenazas. Desafortunadamente, los modelos OpenAI o1 siguen teniendo sesgos de género y raza cuando se prueban, a pesar de los esfuerzos de ajuste.

Los usuarios de ChatGPT Plus y Team junto con los desarrolladores de nivel 5 de uso de API tienen acceso a los modelos o1 de inmediato, y los usuarios de ChatGPT Edu y Enterprise obtendrán acceso la semana del 16 de septiembre. Los usuarios de ChatGPT Free obtendrán acceso a o1- Mini en un futuro próximo. Los modelos o1 no pueden navegar por la web ni aceptar archivos e imágenes cargados para responder preguntas, por lo que OpenAI recomienda a los usuarios continuar usando sus modelos GPT-4o para preguntas generales.

Los usuarios que quieran hacer preguntas sobre IA ahora tienen una amplia gama de modelos LLM capaces para interactuar además de los de OpenAI, incluidos Anthropic Claude, Microsoft CoPilot, Google Gemini y X Grok. Cada IA tiene ventajas específicas, por lo que vale la pena probar varios modelos de IA para encontrar el que mejor se adapte a las necesidades individuales. Algunas de estas IA están integradas en gafas inteligentes (como estas en Amazon) y grabadoras de voz (como esta en Amazon), y algunos robots humanoides autónomos futuros utilizan IA patentada para cocinar y limpiar.

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

Declaración de liberación Este artículo se reproduce en: https://www.notebookcheck.net/OpenAI-o1-and-o1-mini-arrive-AI-that-reason-better-on-STEM-questions-than-prior-models.889335.0. html como Si hay alguna infracción, comuníquese con [email protected] para eliminarla.

Último tutorial Más>

IOS 18.3 Características: Todo nuevo en iOS 18.3
iOS 18.3 es la tercera actualización principal del sistema operativo iOS 18, y aunque no es tan rico en funciones como iOS 18.1 o iOS 18.2, hay algun...

Periféricos tecnológicos Publicado el 2025-03-23
Intel Core Ultra 7 258V Beats AMD Ryzen Z1 Extreme en un juego de referencia de juego
La línea del lago Lunar presenta XE2 LPG IGPU, y la compañía dice que el ARC 140V que se encuentra en algunas de las CPU de gama alta es el "...

Periféricos tecnológicos Publicado el 2025-03-22
Las especificaciones y renders filtradas de Infinix Zero Flip revelan sorprendentes similitudes con el último teléfono de Flip de Tecno
se espera que Infinix anuncie su primer teléfono inteligente plegable pronto, y antes de su lanzamiento, los renders y especificaciones del teléfo...

Periféricos tecnológicos Publicado el 2025-02-25
Todo lo que necesitas saber sobre Apple Intelligence
Apple Intelligence es lo que Apple está llamando su conjunto de características de inteligencia artificial, previsualizado en WWDC en junio de 2024. ...

Periféricos tecnológicos Publicado el 2025-02-23
Lenovo revela una nueva opción de color para la tableta 2024 Legion Y700 Gaming
Lenovo se está preparando para lanzar el 2024 Legion Y700 el 29 de septiembre en China. Esta nueva tableta de juegos Android irá en contra de la R...

Periféricos tecnológicos Publicado el 2025-02-07
$INZONE M9 II: Sony lanza un nuevo monitor de juegos \'perfecto para PS5\' con resolución 4K y brillo máximo de 750 nits$
INZONE M9 II: Sony lanza un nuevo monitor de juegos \'perfecto para PS5\' con resolución 4K y brillo máximo de 750 nits
El INZONE M9 II llega como sucesor directo del INZONE M9, que ahora tiene poco más de dos años. Por cierto, Sony también ha presentado hoy el INZONE M...

Periféricos tecnológicos Publicado el 2024-12-21
Acer confirma la fecha de anuncio de sus portátiles Intel Lunar Lake
El mes pasado, Intel confirmó que lanzará los nuevos chips de la serie Core Ultra 200 el 3 de septiembre. Acer ahora ha anunciado que llevará a cabo s...

Periféricos tecnológicos Publicado el 2024-12-21
AMD Ryzen 7 9800X3D se lanzará en octubre; Ryzen 9 9950X3D y Ryzen 9 9900X3D debutarán el próximo año
El año pasado, AMD lanzó Ryzen 9 7950X3D y Ryzen 9 7900X3D antes que Ryzen 7 7800X3D, que cayó un par de semanas después. Desde entonces, hemos visto ...

Periféricos tecnológicos Publicado el 2024-12-10
Steam regala un juego indie muy popular, pero solo hoy
Press Any Button es un juego arcade independiente desarrollado por el desarrollador en solitario Eugene Zubko y lanzado en 2021. La historia gira en t...

Periféricos tecnológicos Publicado el 2024-11-26
Se informa que las vistas previas de Assassin's Creed Shadows se cancelaron debido a que Ubisoft se retira del Tokyo Game Show 2024
Hoy temprano, Ubisoft canceló su aparición en línea en el Tokyo Game Show debido a “diversas circunstancias”. Este anuncio fue confirmado a través de ...

Periféricos tecnológicos Publicado el 2024-11-25
El precio de un juego de Sony de hace 7 años se duplica repentinamente
La PlayStation 5 Pro se lanza a un precio base de $700, y el paquete completo, que incluye la unidad y el soporte, alcanza un precio de $850. Si bien ...

Periféricos tecnológicos Publicado el 2024-11-22
Oferta | Sale a la venta el bestial portátil para juegos MSI Raider GE78 HX con RTX 4080, Core i9 y 32 GB DDR5
Para los jugadores que utilizan principalmente su computadora portátil para juegos como reemplazo de una computadora de escritorio, una computadora po...

Periféricos tecnológicos Publicado el 2024-11-20
Teenage Engineering presenta el peculiar EP-1320 Medieval como el primer 'instrumentalis electronicum' medieval del mundo
Que Teenage Engineering es una compañía que marcha al ritmo de un baterista muy diferente no es ningún secreto; de hecho, es lo que atrae a sus numero...

Periféricos tecnológicos Publicado el 2024-11-19
Google Photos obtiene ajustes preestablecidos impulsados por IA y nuevas herramientas de edición
Las funciones de edición de video presentes en Google Photos acaban de recibir una infusión de funciones respaldadas por IA, y estos cambios mejorarán...

Periféricos tecnológicos Publicado el 2024-11-19
Se lanzan los globos oculares Tecno Pop 9 5G con apariencia similar al iPhone 16 y especificaciones económicas
Tecno ha confirmado que abandonará el aspecto geométrico del Pop 8 por una joroba de cámara elevada aparentemente inspirada en los nuevos teléfonos 16...

Periféricos tecnológicos Publicado el 2024-11-19

Clasificación Más>

Aprende japonés Aprender coreano Aprender chino Aprender idioma extranjero Juego Problema comun Periféricos tecnológicos AI Tutoriales de software Programación Artículo