OpenAI o1 y o1-mini han llegado. Estos LLM de IA funcionan mucho mejor en tareas y problemas de codificación, matemáticas y ciencias que los modelos anteriores, como GPT-4o, al tomar más tiempo para pensar.
Los problemas complejos en STEM tienden a requerir más que una búsqueda rápida en línea de las respuestas correctas. Al darle a la IA o1 más tiempo para pensar, la IA puede razonar con más cuidado y precisión. El modelo o1-mini ha sido ajustado específicamente para responder preguntas STEM con mayor velocidad y menor demanda de recursos informáticos, y es notablemente mejor en codificación que el modelo o1.
En una variedad de exámenes AP estandarizados y pruebas STEM para LLM, los modelos o1 funcionan con alta precisión. Específicamente, en las pruebas de lectura y escritura basadas en evidencia AP Cálculo, AP Química, AP Física 2, LSAT y SAT, los modelos o1 se desempeñan en o por encima del nivel de grado B (~80% o más). Los modelos responden con precisión en el nivel de grado A en preguntas de física de nivel de doctorado, en el nivel de grado B en preguntas difíciles de matemáticas del American Invitational Mathematics Examination de 2024 y en el nivel de grado B alto en problemas de codificación de Codeforces. Debido a que o1 ha sido optimizado para responder preguntas STEM, su desempeño en Lengua Inglesa AP y Literatura Inglesa AP está en o por debajo del nivel de grado C.
Curiosamente, mientras GPT-4o está estupefacto por el desafío criptográfico de decodificar “oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz” cuando se le da la pista “oyfjdnisdr rtqwainr acxz mynzbhhx” significa “Piensa paso a paso”, o1 no tuvo problemas Pensar en el problema para llegar a la respuesta correcta "Hay tres R en la fresa". Este nuevo poder hará las delicias de los criptógrafos aficionados en casa, así como de la NSA.
Los malhechores del armario querrán saber que, si bien los modelos o1 sin censura pueden dar respuestas preocupantes, OpenAI los ha castrado para su publicación. Los modelos o1 han sido probados para resistirse a responder preguntas sobre la fabricación de armas biológicas, la producción de imágenes atrevidas, el jailbreak y el acoso y las amenazas. Desafortunadamente, los modelos OpenAI o1 siguen teniendo sesgos de género y raza cuando se prueban, a pesar de los esfuerzos de ajuste.
Los usuarios de ChatGPT Plus y Team junto con los desarrolladores de nivel 5 de uso de API tienen acceso a los modelos o1 de inmediato, y los usuarios de ChatGPT Edu y Enterprise obtendrán acceso la semana del 16 de septiembre. Los usuarios de ChatGPT Free obtendrán acceso a o1- Mini en un futuro próximo. Los modelos o1 no pueden navegar por la web ni aceptar archivos e imágenes cargados para responder preguntas, por lo que OpenAI recomienda a los usuarios continuar usando sus modelos GPT-4o para preguntas generales.
Los usuarios que quieran hacer preguntas sobre IA ahora tienen una amplia gama de modelos LLM capaces para interactuar además de los de OpenAI, incluidos Anthropic Claude, Microsoft CoPilot, Google Gemini y X Grok. Cada IA tiene ventajas específicas, por lo que vale la pena probar varios modelos de IA para encontrar el que mejor se adapte a las necesidades individuales. Algunas de estas IA están integradas en gafas inteligentes (como estas en Amazon) y grabadoras de voz (como esta en Amazon), y algunos robots humanoides autónomos futuros utilizan IA patentada para cocinar y limpiar.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3