Pourquoi le contexte d'un million de jetons de Gemini 1.5 change la donne

Page de garde > IA > Pourquoi le contexte d'un million de jetons de Gemini 1.5 change la donne

Pourquoi le contexte d'un million de jetons de Gemini 1.5 change la donne

Publié le 2024-08-21

Parcourir:603

Google Gemini 1.5 est désormais livré avec une énorme fenêtre contextuelle d'un million de jetons, éclipsant sa concurrence directe dans ChatGPT, Claude et d'autres chatbots IA.

Cela ressemble à une mise à niveau massive et pourrait distinguer les Gémeaux. Il est un peu difficile d'en saisir toute l'étendue, mais l'énorme fenêtre contextuelle de Gemini pourrait changer la donne.

Qu'est-ce qu'une fenêtre contextuelle ?

Lorsqu'ils répondent à vos requêtes, comme expliquer un concept ou résumer un texte, les modèles d'IA ont une limite quant à la quantité de données qu'ils peuvent prendre en compte pour générer une réponse. La limite de la taille du texte qu'il peut prendre en compte est appelée fenêtre contextuelle.

Voici une autre façon de voir les choses. Disons que vous allez dans une épicerie pour faire vos courses sans votre liste d'épicerie. La limite du nombre de produits d'épicerie dont vous vous souvenez lorsque vous faites vos courses est votre fenêtre contextuelle. Plus vous vous souvenez de courses, plus vous avez de chances de ne pas gâcher vos projets d'achats. De même, plus la fenêtre contextuelle d'un modèle d'IA est grande, plus le modèle a de chances de se souvenir de tout ce dont il a besoin pour vous fournir les meilleurs résultats.

Au moment de la rédaction, la fenêtre contextuelle de 200 000 d'Anthropic Claude 2.1 est la plus grande fenêtre contextuelle de tous les modèles d'IA généralement disponibles. Vient ensuite GPT-4 Turbo avec une fenêtre contextuelle de 128 Ko. Google Gemini 1.5 apporte une fenêtre contextuelle d'un million, quatre fois plus grande que tout ce qui existe sur le marché. Cela nous amène à la grande question : quel est le problème avec une fenêtre contextuelle d'un million de jetons ?

Pourquoi la fenêtre contextuelle de Gemini 1.5 est un gros problème

$Why Gemini 1.5\'s One Million Token Context Is a Game Changer$

Pour le mettre dans une perspective plus claire, la fenêtre contextuelle de 200 000 de Claude AI signifie qu'elle peut digérer un livre d'environ 150 000 mots et y apporter des réponses. C'est énorme. Mais le Gemini 1.5 de Google serait capable de digérer 700 000 mots d'un coup !

Lorsque vous introduisez un gros bloc de texte dans des chatbots IA comme ChatGPT ou Gemini, il tente de digérer autant de texte que possible, mais la quantité qu'il peut digérer dépend de sa fenêtre contextuelle. Ainsi, si vous avez une conversation qui comprend 100 000 mots sur un modèle qui ne peut en gérer que 28 000 et que vous commencez ensuite à poser des questions qui nécessitent une connaissance complète de l'ensemble des 100 000 mots de la conversation, vous la préparez à l'échec.

Imaginez que vous regardiez seulement 20 minutes d'un film d'une heure, mais qu'on vous demande d'expliquer l'intégralité du film. Quels seraient vos résultats ? Soit vous refusez de répondre, soit vous inventez simplement des choses, ce qui est exactement ce que ferait un chatbot IA, conduisant à des hallucinations IA.

Maintenant, si vous pensez que vous n'avez jamais eu à introduire 100 000 mots dans un chatbot, ce n'est pas toute la considération. La fenêtre contextuelle transcende uniquement le texte que vous alimentez avec un modèle d'IA en une seule invite. Les modèles d'IA prennent en compte l'ensemble de la conversation que vous avez eue au cours d'une session de chat pour garantir que leurs réponses sont aussi pertinentes que possible.

Ainsi, même si vous ne lui donnez pas un livre de 100 000 mots, vos échanges et les réponses qu'il fournit s'ajoutent tous au calcul de la fenêtre contextuelle. Vous vous demandez pourquoi ChatGPT ou Gemini de Google continuent d'oublier les choses que vous lui avez dites plus tôt dans une conversation ? Il a probablement manqué d'espace dans la fenêtre de contexte et a commencé à oublier des choses.

Une fenêtre contextuelle plus grande est particulièrement importante pour les tâches nécessitant une compréhension approfondie du contexte, telles que résumer de longs articles, répondre à des questions complexes ou maintenir un récit cohérent dans le texte généré. Vous voulez écrire un roman de 50 000 mots avec une narration cohérente tout au long ? Vous voulez un modèle capable de « regarder » et de répondre aux questions sur un fichier vidéo d'une heure ? Vous avez besoin d'une fenêtre contextuelle plus grande !

En bref, la fenêtre contextuelle plus grande de Gemini 1.5 peut améliorer considérablement les performances de son modèle d'IA, réduisant les hallucinations et augmentant considérablement la précision et la capacité à mieux suivre les instructions.

Gemini 1.5 sera-t-il à la hauteur des attentes ?

$Why Gemini 1.5\'s One Million Token Context Is a Game Changer$

Si tout se passe comme prévu, Gemini 1.5 pourrait potentiellement surpasser les meilleurs modèles d'IA du marché. Cependant, compte tenu des nombreux échecs de Google dans la création d’un modèle d’IA stable, il est important de faire preuve de prudence. Augmenter la fenêtre contextuelle d'un modèle à lui seul n'améliore pas automatiquement le modèle.

J'utilise la fenêtre contextuelle de 200 000 de Claude 2.1 depuis des mois depuis sa sortie, et une chose est claire pour moi : une fenêtre contextuelle plus grande peut en effet améliorer la sensibilité au contexte, mais des problèmes avec les performances du modèle de base peuvent rendre un contexte plus large constitue un problème en soi.

Google Gemini 1.5 va-t-il changer la donne ? Les réseaux sociaux regorgent actuellement de critiques élogieuses sur Gemini 1.5 émanant d'utilisateurs à accès anticipé. Cependant, la plupart des avis 5 étoiles proviennent de cas d’utilisation précipités ou simplifiés. Un bon endroit pour vérifier les performances de Gemini 1.5 dans la nature est le rapport technique Gemini 1.5 de Google [PDF]. Le rapport montre que même lors de « tests contrôlés », le modèle n'a pas pu récupérer tous les petits détails des documents dans la taille de sa fenêtre contextuelle.

Une fenêtre contextuelle d'un million de jetons est en effet une prouesse technique impressionnante, mais sans pouvoir récupérer les détails d'un document de manière fiable, alors une fenêtre contextuelle plus grande n'a que peu de valeur pratique et pourrait même devenir une cause de refus précision et hallucinations.

Déclaration de sortie Cet article est reproduit sur : https://www.makeuseof.com/why-gemini-context-window-is-a-game-changer/ En cas de violation, veuillez contacter [email protected] pour le supprimer.

Dernier tutoriel Plus>

Que sont les agents de l'IA? - Guide d'analyse et d'application
Artificial Intelligence (AI) is rapidly evolving, and 2025 is shaping up to be the year of AI agents. But what are AI agents...

IA Publié le 2025-05-01
Détection de genre avec OpenCV et Roboflow dans Python - Analytics Vidhya
Introduction La détection de genre à partir d'images faciales est l'une des nombreuses applications fascinantes de la vision par ordinateur. ...

IA Publié le 2025-04-29
Pensée à la machine en premier: la montée de l'IA stratégique
STRATEGIC AI Prologue 11. May 1997, New York City. It was a beautiful spring day in New York City. The skies were clear, and temperatures were climbin...

IA Publié le 2025-04-29
8 recommandations API gratuites et payantes essentielles pour LLM
exploitant la puissance des LLMS: un guide des API pour les modèles de grande langue Dans le paysage commercial dynamique d'aujourd'hui, le...

IA Publié le 2025-04-21
Guide de l'utilisateur: Falcon 3-7b Instruct Modèle
Falcon 3 de Tii: un saut révolutionnaire en open-source ai La poursuite ambitieuse de Tii de redéfinir AI atteint de nouveaux sommets avec le modèl...

IA Publié le 2025-04-20
Deepseek-V3 contre GPT-4O et LLAMA 3.3 70B: le modèle d'IA le plus fort révélé
The evolution of AI language models has set new standards, especially in the coding and programming landscape. Leading the c...

IA Publié le 2025-04-18
Top 5 des outils de budgétisation intelligents d'IA
Déverrouiller la liberté financière avec AI: applications budgétaires de haut niveau en Inde Êtes-vous fatigué de vous demander constamment où va v...

IA Publié le 2025-04-17
Explication détaillée de la fonction Excel Sumproduct - École d'analyse des données
Fonction de sumproduct d'Excel: une puissance d'analyse des données Déverrouillez la puissance de la fonction de sumproduct d'Excel pou...

IA Publié le 2025-04-16
Des recherches approfondies sont entièrement ouvertes, les avantages sociaux des utilisateurs de chatppt plus
Recherche profonde d'Openai: un changeur de jeu pour la recherche sur l'IA Openai a déclenché une recherche approfondie pour tous les abonn...

IA Publié le 2025-04-16
Amazon Nova aujourd'hui Vraie Expérience et revue - Analytics Vidhya
Amazon dévoile Nova: Modèles de fondation de pointe pour la création de l'IA et du contenu améliorées L'événement Re: Invent 2024 d'Ama...

IA Publié le 2025-04-16
5 façons d'utiliser la fonction de tâche de synchronisation de Chatgpt
Les nouvelles tâches planifiées de Chatgpt: automatiser votre journée avec ai Chatgpt a récemment introduit une fonctionnalité révolutionnaire: les...

IA Publié le 2025-04-16
Laquelle des trois chatbots d'IA répond à la même invite est la meilleure?
avec des options comme Claude, Chatgpt et Gemini, le choix d'un chatbot peut sembler écrasant. Pour aider à couper le bruit, je mets les trois...

IA Publié le 2025-04-15
Chatgpt est suffisant, aucune machine de chat AI dédiée n'est nécessaire
Dans un monde avec de nouveaux chatbots d'IA qui lancent quotidiennement, il peut être écrasant de décider lequel est le bon «un». Mais d'apr...

IA Publié le 2025-04-14
Moment indien de l'IA: concurrence avec la Chine et les États-Unis dans une AI générative
India's Ai Ambitions: une mise à jour 2025 avec la Chine et les États-Unis qui investissent fortement dans l'IA génératrice, l'Inde acc...

IA Publié le 2025-04-13
Automatisation l'importation de CSV à PostgreSQL à l'aide de flux d'air et de docker
Ce didacticiel montre la création d'un pipeline de données robuste à l'aide d'Apache Airflow, Docker et PostgreSQL pour automatiser le tr...

IA Publié le 2025-04-12

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article