OpenAI o1 e o1-mini chegam como IAs que lidam com questões STEM melhor do que os modelos anteriores

Primeira página > Periféricos de tecnologia > OpenAI o1 e o1-mini chegam como IAs que lidam com questões STEM melhor do que os modelos anteriores

OpenAI o1 e o1-mini chegam como IAs que lidam com questões STEM melhor do que os modelos anteriores

Publicado em 31/10/2024

Navegar:526

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 e o1-mini chegaram. Esses LLMs de IA têm desempenho muito melhor em problemas e tarefas de codificação, matemática e ciências do que modelos anteriores, como GPT-4o, levando mais tempo para pensar.

Problemas complexos em STEM tendem a exigir mais do que uma rápida pesquisa online por respostas corretas. Ao dar à IA o1 mais tempo para pensar, a IA pode raciocinar com mais cuidado e precisão. O modelo o1-mini foi ajustado especificamente para responder questões STEM com velocidade mais rápida e menor demanda de recursos do computador, e é notavelmente melhor em codificação do que o modelo o1.

Em uma variedade de exames AP padronizados e testes STEM para LLMs, os modelos o1 apresentam desempenho com alta precisão. Especificamente, nos testes AP Calculus, AP Chemistry, AP Physics 2, LSAT e SAT de leitura e escrita baseados em evidências, os modelos o1 têm desempenho igual ou superior ao nível B (~80% ou superior). Os modelos respondem com precisão no nível A em questões de física de nível de doutorado, no nível B em questões difíceis de matemática do American Invitational Mathematics Examination de 2024 e no nível B alto em problemas de codificação Codeforces. Como o1 foi ajustado para responder perguntas STEM, seu desempenho em Língua Inglesa AP e Literatura Inglesa AP é igual ou inferior ao nível C-grade.

Curiosamente, enquanto o GPT-4o fica pasmo com o desafio criptográfico de decodificar “oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz” quando recebe a dica “oyfjdnisdr rtqwainr acxz mynzbhhx” significa “Pense passo a passo”, o1 não teve problemas pensando no problema para chegar à resposta correta “Existem três R's no morango”. Este novo poder irá deliciar os criptógrafos amadores em casa, bem como a NSA.

Os malfeitores do armário vão querer saber que, embora os modelos o1 não censurados sejam capazes de dar respostas preocupantes, a OpenAI castrou esses modelos para lançamento. Os modelos o1 foram testados para resistir a responder perguntas sobre a fabricação de armas biológicas, a produção de imagens perversas, o próprio jailbreak e o assédio e a ameaça. Infelizmente, os modelos OpenAI o1 permanecem tendenciosos em termos de gênero e raça quando testados, apesar dos esforços de ajuste.

Os usuários do ChatGPT Plus e Team, juntamente com os desenvolvedores de nível 5 de uso da API, terão acesso aos modelos o1 imediatamente, e os usuários do ChatGPT Edu e Enterprise terão acesso na semana de 16 de setembro. Os usuários do ChatGPT Free terão acesso ao o1- mini em um futuro próximo. Os modelos o1 não podem navegar na web ou aceitar arquivos e imagens carregados para responder perguntas, então a OpenAI recomenda que os usuários continuem usando seus modelos GPT-4o para perguntas gerais.

Os usuários que desejam fazer perguntas sobre IA agora têm uma ampla gama de modelos LLM capazes para interagir, além daqueles da OpenAI, incluindo Anthropic Claude, Microsoft CoPilot, Google Gemini e X Grok. Cada IA tem vantagens específicas, por isso vale a pena testar vários modelos de IA para encontrar aquele que melhor se adapta às necessidades individuais. Algumas dessas IA são integradas em óculos inteligentes (como estes na Amazon) e gravadores de voz (como este na Amazon), e alguns robôs humanoides autônomos que estão por vir usam IA proprietária para cozinhar e limpar.

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

Declaração de lançamento Este artigo foi reproduzido em: https://www.notebookcheck.net/OpenAI-o1-and-o1-mini-arrive-AI-that-reason-better-on-STEM-questions-than-prior-models.889335.0. html como Se houver alguma violação, entre em contato com [email protected] para excluí-la.

Tutorial mais recente Mais>

iOS 18.3 Recursos: tudo novo no iOS 18.3
iOS 18.3 é a terceira grande atualização para o sistema operacional iOS 18 e, embora não seja tão rico quanto o iOS 18.1 ou iOS 18.2, há algumas muda...

Periféricos de tecnologia Postado em 2025-03-23
Intel Core Ultra 7 258V Beats AMD Ryzen Z1 Extreme em uma referência de jogo
A linha do Lago Lunar Intel apresenta XE2 LPG IGPU, e a empresa diz que o arco 140V encontrado em algumas das CPUs de ponta é a "melhor GPU i...

Periféricos de tecnologia Postado em 2025-03-22
$As especificações e renderizações vazadas do Infinix Zero Flip revelam semelhanças impressionantes com o mais recente telefone flip de Tecno \$
As especificações e renderizações vazadas do Infinix Zero Flip revelam semelhanças impressionantes com o mais recente telefone flip de Tecno \
A Infinix deve anunciar seu primeiro smartphone dobrável em breve e antes de seu lançamento, renderiza e especificações do telefone, chamado Infin...

Periféricos de tecnologia Postado em 2025-02-25
Tudo o que você precisa saber sobre a inteligência da Apple
Apple Intelligence é o que a Apple está chamando de seu conjunto de recursos de inteligência artificial, visualizado no WWDC em junho de 2024. Os pri...

Periféricos de tecnologia Postado em 2025-02-23
Lenovo revela uma nova opção de cor para o tablet para jogos 2024 Legion Y700
Lenovo está se preparando para lançar o 2024 Legion Y700 em 29 de setembro na China. Este novo tablet para jogos Android estará indo contra o Redm...

Periféricos de tecnologia Postado em 2025-02-07
INZONE M9 II: Sony lança novo monitor de jogos ‘perfeito para PS5’ com resolução 4K e brilho máximo de 750 nits
O INZONE M9 II chega como sucessor direto do INZONE M9, que já tem pouco mais de dois anos. Aliás, a Sony também apresentou hoje o INZONE M10S, que ab...

Periféricos de tecnologia Publicado em 2024-12-21
Acer confirma a data de anúncio de seus laptops Intel Lunar Lake
No mês passado, a Intel confirmou que lançará os novos chips da série Core Ultra 200 em 3 de setembro. A Acer anunciou agora que realizará seu evento ...

Periféricos de tecnologia Publicado em 2024-12-21
AMD Ryzen 7 9800X3D previsto para lançamento em outubro; Ryzen 9 9950X3D e Ryzen 9 9900X3D serão lançados no próximo ano
No ano passado, a AMD lançou o Ryzen 9 7950X3D e o Ryzen 9 7900X3D antes do Ryzen 7 7800X3D, que foi lançado algumas semanas depois. Desde então, vimo...

Periféricos de tecnologia Publicado em 2024-12-10
O Steam está distribuindo um jogo indie muito popular, mas só hoje
Press Any Button é um jogo de arcade independente desenvolvido pelo desenvolvedor solo Eugene Zubko e lançado em 2021. A história gira em torno de A-E...

Periféricos de tecnologia Publicado em 2024-11-26
Prévias de Assassin’s Creed Shadows supostamente canceladas enquanto a Ubisoft desiste do Tokyo Game Show 2024
Hoje cedo, a Ubisoft cancelou sua aparição online na Tokyo Game Show devido a “várias circunstâncias”. Este anúncio foi confirmado por meio de um twee...

Periféricos de tecnologia Publicado em 2024-11-25
Preço de jogo da Sony de 7 anos dobra repentinamente
O PlayStation 5 Pro é lançado com preço base de US$ 700, com o pacote completo, incluindo unidade e suporte, chegando a US$ 850. Embora a Sony argumen...

Periféricos de tecnologia Publicado em 2024-11-22
Acordo | O bestial laptop para jogos MSI Raider GE78 HX com RTX 4080, Core i9 e 32 GB DDR5 está à venda
Para jogadores que usam principalmente seus laptops para jogos como substitutos de desktops, um notebook grande como o MSI Raider GE78 HX pode ser a m...

Periféricos de tecnologia Publicado em 2024-11-20
Teenage Engineering revela o peculiar EP-1320 Medieval como o primeiro ‘instrumentalis electronicum’ medieval do mundo
Que a Teenage Engineering é uma empresa que marcha ao ritmo de um baterista muito diferente não é segredo – é na verdade o que atrai seus muitos fãs. ...

Periféricos de tecnologia Publicado em 19/11/2024
O Google Fotos obtém predefinições com tecnologia de IA e novas ferramentas de edição
Os recursos de edição de vídeo presentes no Google Fotos acabam de receber uma infusão de recursos apoiados por IA, e essas mudanças irão melhorar a e...

Periféricos de tecnologia Publicado em 19/11/2024
Os olhos do Tecno Pop 9 5G são lançados com aparência semelhante ao iPhone 16 e especificações de orçamento
A Tecno confirmou que abandonará a aparência geométrica do Pop 8 por uma câmera elevada, ostensivamente inspirada nos novos Phone16 e 16 Plus em seu s...

Periféricos de tecnologia Publicado em 19/11/2024

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo