OpenAI o1 e o1-mini chegaram. Esses LLMs de IA têm desempenho muito melhor em problemas e tarefas de codificação, matemática e ciências do que modelos anteriores, como GPT-4o, levando mais tempo para pensar.
Problemas complexos em STEM tendem a exigir mais do que uma rápida pesquisa online por respostas corretas. Ao dar à IA o1 mais tempo para pensar, a IA pode raciocinar com mais cuidado e precisão. O modelo o1-mini foi ajustado especificamente para responder questões STEM com velocidade mais rápida e menor demanda de recursos do computador, e é notavelmente melhor em codificação do que o modelo o1.
Em uma variedade de exames AP padronizados e testes STEM para LLMs, os modelos o1 apresentam desempenho com alta precisão. Especificamente, nos testes AP Calculus, AP Chemistry, AP Physics 2, LSAT e SAT de leitura e escrita baseados em evidências, os modelos o1 têm desempenho igual ou superior ao nível B (~80% ou superior). Os modelos respondem com precisão no nível A em questões de física de nível de doutorado, no nível B em questões difíceis de matemática do American Invitational Mathematics Examination de 2024 e no nível B alto em problemas de codificação Codeforces. Como o1 foi ajustado para responder perguntas STEM, seu desempenho em Língua Inglesa AP e Literatura Inglesa AP é igual ou inferior ao nível C-grade.
Curiosamente, enquanto o GPT-4o fica pasmo com o desafio criptográfico de decodificar “oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz” quando recebe a dica “oyfjdnisdr rtqwainr acxz mynzbhhx” significa “Pense passo a passo”, o1 não teve problemas pensando no problema para chegar à resposta correta “Existem três R's no morango”. Este novo poder irá deliciar os criptógrafos amadores em casa, bem como a NSA.
Os malfeitores do armário vão querer saber que, embora os modelos o1 não censurados sejam capazes de dar respostas preocupantes, a OpenAI castrou esses modelos para lançamento. Os modelos o1 foram testados para resistir a responder perguntas sobre a fabricação de armas biológicas, a produção de imagens perversas, o próprio jailbreak e o assédio e a ameaça. Infelizmente, os modelos OpenAI o1 permanecem tendenciosos em termos de gênero e raça quando testados, apesar dos esforços de ajuste.
Os usuários do ChatGPT Plus e Team, juntamente com os desenvolvedores de nível 5 de uso da API, terão acesso aos modelos o1 imediatamente, e os usuários do ChatGPT Edu e Enterprise terão acesso na semana de 16 de setembro. Os usuários do ChatGPT Free terão acesso ao o1- mini em um futuro próximo. Os modelos o1 não podem navegar na web ou aceitar arquivos e imagens carregados para responder perguntas, então a OpenAI recomenda que os usuários continuem usando seus modelos GPT-4o para perguntas gerais.
Os usuários que desejam fazer perguntas sobre IA agora têm uma ampla gama de modelos LLM capazes para interagir, além daqueles da OpenAI, incluindo Anthropic Claude, Microsoft CoPilot, Google Gemini e X Grok. Cada IA tem vantagens específicas, por isso vale a pena testar vários modelos de IA para encontrar aquele que melhor se adapta às necessidades individuais. Algumas dessas IA são integradas em óculos inteligentes (como estes na Amazon) e gravadores de voz (como este na Amazon), e alguns robôs humanoides autônomos que estão por vir usam IA proprietária para cozinhar e limpar.
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3