Por que o contexto de um milhão de tokens do Gemini 1.5 é uma virada de jogo

Primeira página > IA > Por que o contexto de um milhão de tokens do Gemini 1.5 é uma virada de jogo

Por que o contexto de um milhão de tokens do Gemini 1.5 é uma virada de jogo

Publicado em 2024-08-21

Navegar:957

O Google Gemini 1.5 agora vem com uma enorme janela de contexto de um milhão de tokens, superando sua concorrência direta no ChatGPT, Claude e outros chatbots de IA.

Parece uma grande atualização e pode diferenciar Gêmeos. É um pouco difícil compreender toda a sua extensão, mas a enorme janela de contexto do Gemini pode mudar o jogo.

O que é uma janela de contexto?

Ao responder às suas perguntas, como explicar um conceito ou resumir um texto, os modelos de IA têm um limite na quantidade de dados que podem considerar para gerar uma resposta. O limite do tamanho do texto que ele pode considerar é chamado de janela de contexto.

Aqui está outra maneira de ver isso. Digamos que você vá a um supermercado para comprar mantimentos sem sua lista de compras. O limite de quantos mantimentos você lembra ao fazer compras é a sua janela de contexto. Quanto mais compras você lembrar, maiores serão as chances de não atrapalhar seus planos de compras. Da mesma forma, quanto maior a janela de contexto de um modelo de IA, maiores serão as chances de o modelo se lembrar de tudo o que precisa para fornecer os melhores resultados.

No momento em que este artigo foi escrito, a janela de contexto de 200k do Claude 2.1 da Anthropic é a maior janela de contexto de qualquer modelo de IA geralmente disponível. Isto é seguido pelo GPT-4 Turbo com uma janela de contexto de 128k. O Google Gemini 1.5 traz uma janela de contexto de um milhão, quatro vezes maior do que qualquer coisa no mercado. Isso leva à grande questão: qual é o problema de uma janela de contexto de um milhão de tokens?

Por que a janela de contexto do Gemini 1.5 é um grande negócio

$Why Gemini 1.5\'s One Million Token Context Is a Game Changer$

Para colocar isso em uma perspectiva mais clara, a janela de contexto de 200k do Claude AI significa que ele pode digerir um livro de cerca de 150.000 palavras e forneça respostas para isso. Isso é enorme. Mas o Gemini 1.5 do Google seria capaz de digerir 700 mil palavras de uma só vez!

Quando você alimenta um grande bloco de texto em chatbots de IA como ChatGPT ou Gemini, ele tenta digerir o máximo de texto possível, mas o quanto ele pode digerir depende de sua janela de contexto. Então, se você tem uma conversa que envolve 100 mil palavras em um modelo que só pode lidar com 28 mil e então começa a fazer perguntas que exigem que ele tenha conhecimento completo de todas as 100 mil palavras da conversa, você está configurando-a para falhar.

Imagine assistir apenas 20 minutos de um filme de uma hora, mas ser solicitado a explicar o filme inteiro. Quão bons seriam seus resultados? Você se recusa a responder ou simplesmente inventa coisas, que é exatamente o que um chatbot de IA faria, levando a alucinações de IA.

Agora, se você está pensando que nunca precisou inserir 100 mil palavras em um chatbot, essa não é toda a consideração. A janela de contexto transcende apenas o texto que você alimenta um modelo de IA em um único prompt. Os modelos de IA consideram toda a conversa que você teve durante uma sessão de chat para garantir que suas respostas sejam tão relevantes quanto possível.

Portanto, mesmo que você não esteja alimentando-o com um livro de 100 mil palavras, suas conversas de ida e volta e as respostas que ele fornece são adicionadas ao cálculo da janela de contexto. Quer saber por que o ChatGPT ou o Gemini do Google continuam esquecendo as coisas que você disse anteriormente em uma conversa? Provavelmente ficou sem espaço na janela de contexto e começou a esquecer coisas.

Uma janela de contexto maior é particularmente importante para tarefas que exigem uma compreensão profunda do contexto, como resumir artigos longos, responder a perguntas complexas ou manter uma narrativa coerente no texto gerado. Quer escrever um romance de 50 mil palavras que tenha uma narrativa consistente? Quer um modelo que possa “assistir” e responder perguntas em um arquivo de vídeo de uma hora? Você precisa de uma janela de contexto maior!

Resumindo, a janela de contexto maior do Gemini 1.5 pode melhorar significativamente o desempenho de seu modelo de IA, reduzindo alucinações e aumentando significativamente a precisão e a capacidade de seguir melhor as instruções.

O Gemini 1.5 corresponderá às expectativas?

$Why Gemini 1.5\'s One Million Token Context Is a Game Changer$

Se tudo correr como planejado, o Gemini 1.5 poderá superar os melhores modelos de IA do mercado. No entanto, considerando as muitas falhas do Google na construção de um modelo de IA estável, é importante agir com cautela. Aumentar a janela de contexto de um modelo por si só não torna o modelo melhor automaticamente.

Eu usei a janela de contexto de 200k do Claude 2.1 por meses desde seu lançamento, e uma coisa está clara para mim: uma janela de contexto maior pode de fato melhorar a sensibilidade ao contexto, mas problemas com o desempenho do modelo principal podem tornar contexto mais amplo, um problema em si.

O Google Gemini 1.5 nos proporcionará uma virada de jogo? Atualmente, a mídia social está repleta de críticas elogiosas do Gemini 1.5 de usuários com acesso antecipado. No entanto, a maioria das avaliações 5 estrelas resulta de casos de uso apressados ou simplificados. Um bom lugar para verificar o desempenho do Gemini 1.5 em estado selvagem é no relatório técnico do Google Gemini 1.5 [PDF]. O relatório mostra que mesmo durante os “testes controlados”, o modelo não conseguiu recuperar todos os pequenos detalhes dos documentos dentro do tamanho da sua janela de contexto.

Uma janela de contexto de um milhão de tokens é de fato um feito técnico impressionante, mas sem ser capaz de recuperar os detalhes de um documento de forma confiável, então uma janela de contexto maior tem pouco valor prático e pode até se tornar uma causa de declínio precisão e alucinações.

Declaração de lançamento Este artigo foi reproduzido em: https://www.makeuseof.com/why-gemini-context-window-is-a-game-changer/ Se houver alguma violação, entre em contato com [email protected] para excluí-lo

Tutorial mais recente Mais>

Abandonei o ChatGPT por esta alternativa superior: 3 razões
Vamos direto ao assunto: mudei do ChatGPT para o Claude. Não é que o ChatGPT não seja bom – é. Mas para as minhas necessidades, Claude tem algumas va...

IA Publicado em 2024-11-02
Como usar o ChatGPT da OpenAI
Além de poder redigir um e-mail de trabalho, o ChatGPT pode fornecer feedback sobre sua apresentação, sugerir um roteiro para um fim de semana fora o...

IA Publicado em 2024-11-02
GPT-4o traz GPT-4 para todos e é assim que funciona
Então, o que é GPT-4o? O que é GPT-4o? GPT-4o é o mais novo modelo de IA do desenvolvedor ChatGPT OpenAI, revelado em seu evento "Spring Updat...

IA Publicado em 2024-11-02
Microsoft compra Blizzard, arte e tradução de IA exploradas [Podcast]
O podcast desta semana responde a essas perguntas e reflete sobre o impacto do governo do Reino Unido autorizando a aquisição da Activision Blizzard ...

IA Publicado em 01/11/2024
Além dos LLMs: Veja por que os modelos de linguagem pequena são o futuro da IA
Grandes modelos de linguagem (LLMs) entraram em cena com o lançamento do ChatGPT da Open AI. Desde então, várias empresas também lançaram seus LLMs, m...

IA Publicado em 01/11/2024
Os 5 melhores geradores de imagens de IA de código aberto
Existem dezenas de geradores de texto para imagem de IA gratuitos e de código aberto disponíveis na Internet, especializados em tipos específicos de ...

IA Publicado em 2024-09-02
OpenAI lança loja GPT personalizada: como acessá-la e usá-la agora mesmo
OpenAI finalmente revelou sua tão aguardada GPT Store, oferecendo aos usuários uma seleção de GPTs personalizados criados pela comunidade ChatGPT com...

IA Publicado em 2024-09-02
O que é Claude 3 e o que você pode fazer com ele?
A Anthropic anunciou o lançamento do Claude 3 – uma família de modelos de IA com potencial para perturbar o GPT-4. Tem um potencial extraordinário, m...

IA Publicado em 01/09/2024
ChatGPT acaba de adicionar uma série de novos recursos: aqui estão aqueles com os quais você se importa
A atualização do ChatGPT do OpenAI no início de maio de 2024 foi enorme, trazendo muitos novos recursos para o chatbot de IA generativo líder mundial...

IA Publicado em 01/09/2024
Usou um LLM? Os LAMs estão chegando, mas precisam de trabalho
A ascensão dos chatbots generativos de IA popularizou o termo "modelo de linguagem grande", a tecnologia de IA subjacente que trabalha nos ...

IA Publicado em 31/08/2024
As 5 melhores maneiras de usar as instruções personalizadas do ChatGPT
ChatGPT tradicionalmente luta com personalização e consistência de memória. Para corrigir isso, a OpenAI introduziu instruções personalizadas para ca...

IA Publicado em 31/08/2024
A atualização mais recente do ChatGPT permite criar modelos GPT totalmente personalizados
ChatGPT, o principal produto de IA da OpenAI, recebeu uma atualização revolucionária com vários novos recursos. Com várias atualizações importantes s...

IA Publicado em 2024-08-29
Por que você não deve confiar no ChatGPT para resumir seu texto
Existem limites para o que o ChatGPT sabe. E a sua programação obriga-o a entregar o que você pede, mesmo que o resultado esteja errado. Isso signifi...

IA Publicado em 2024-08-29
Copilot vs. Copilot Pro: Qual é a diferença e você deve atualizar?
O Microsoft Copilot tem sido o refúgio para quem deseja usar o ChatGPT Plus da OpenAI sem desembolsar todos os meses. E você ficará muito satisfeito...

IA Publicado em 2024-08-28
Como usar o widget ChatGPT no Android
Antes de continuar, você precisará atualizar o aplicativo ChatGPT para Android - se você estiver em qualquer versão anterior a 1.2024.052, não poderá...

IA Publicado em 2024-08-28

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo