Почему контекст на миллион токенов Gemini 1.5 меняет правила игры

титульная страница > ИИ > Почему контекст на миллион токенов Gemini 1.5 меняет правила игры

Почему контекст на миллион токенов Gemini 1.5 меняет правила игры

Опубликовано 21 августа 2024 г.

Просматривать:724

Google Gemini 1.5 теперь поставляется с огромным контекстным окном в один миллион токенов, что затмевает его прямую конкуренцию в ChatGPT, Claude и других чат-ботах с искусственным интеллектом.

Звучит как масштабное обновление, которое может выделить Gemini среди конкурентов. Немного сложно в полной мере осознать его масштабы, но огромное контекстное окно Gemini может изменить правила игры.

Что такое контекстное окно?

При ответе на ваши запросы, например при объяснении концепции или кратком изложении текста, модели ИИ имеют ограничение на объем данных, которые они могут учитывать для генерации ответа. Ограничение на размер текста, которое он может учитывать, называется контекстным окном.

Вот еще один взгляд на это. Допустим, вы идете в продуктовый магазин за продуктами, не имея списка покупок. Ограничение на количество продуктов, которые вы запоминаете при совершении покупок, — это ваше контекстное окно. Чем больше продуктов вы сможете запомнить, тем выше шансы не испортить планы покупок. Аналогичным образом, чем больше контекстное окно модели ИИ, тем выше вероятность того, что модель запомнит все, что ей нужно, чтобы предоставить вам наилучшие результаты.

На момент написания 200-тысячное контекстное окно Anthropic Claude 2.1 является самым большим контекстным окном среди всех общедоступных моделей искусственного интеллекта. Далее следует GPT-4 Turbo с контекстным окном 128 КБ. Google Gemini 1.5 предлагает миллион контекстных окон, что в четыре раза больше, чем что-либо на рынке. Это приводит к большому вопросу: что такого страшного в контекстном окне в миллион токенов?

Почему контекстное окно Gemini 1.5 так важно?

$Why Gemini 1.5\'s One Million Token Context Is a Game Changer$

Чтобы представить это более ясно, контекстное окно Claude AI на 200 тысяч слов означает, что он может переварить книгу, содержащую около 150 000 слов, и дать на него ответы. Это грандиозно. Но Gemini 1.5 от Google сможет переварить 700 000 слов за раз!

Когда вы передаете большой текстовый блок в чат-боты с искусственным интеллектом, такие как ChatGPT или Gemini, он пытается переварить как можно больше текста, но то, сколько он может переварить, зависит от его контекстного окна. Итак, если у вас есть разговор, объем которого составляет 100 тысяч слов, на модели, которая может обрабатывать только 28 тысяч слов, а затем вы начинаете задавать вопросы, требующие от нее полного знания всех 100 тысяч слов разговора, вы настраиваете его на провал.

Представьте себе, что вы смотрите всего 20 минут часового фильма, но вас просят объяснить весь фильм. Насколько хорошими будут ваши результаты? Вы либо отказываетесь отвечать, либо просто выдумываете всякую ерунду, что и сделал бы чат-бот с искусственным интеллектом, что приводит к галлюцинациям искусственного интеллекта.

Итак, если вы думаете, что вам никогда не приходилось вводить 100 тысяч слов в чат-бот, это еще не все. Контекстное окно выходит за рамки просто текста, который вы передаете модели ИИ в одном приглашении. Модели искусственного интеллекта учитывают весь ваш разговор во время сеанса чата, чтобы обеспечить максимально релевантные ответы.

Итак, даже если вы не передаете ему книгу на 100 тысяч слов, ваши двусторонние разговоры и ответы, которые он предоставляет, - все это добавляется к вычислению контекстного окна. Хотите знать, почему ChatGPT или Gemini от Google постоянно забывают то, что вы сказали им ранее в разговоре? Вероятно, ему не хватило места в контекстном окне, и он начал что-то забывать.

Большее контекстное окно особенно важно для задач, требующих глубокого понимания контекста, таких как подведение итогов длинных статей, ответы на сложные вопросы или поддержание связного повествования в сгенерированном тексте. Хотите написать роман из 50 тысяч слов, в котором будет последовательное повествование? Хотите модель, которая сможет «смотреть» часовой видеофайл и отвечать на вопросы? Вам нужно контекстное окно большего размера!

Короче говоря, большее контекстное окно Gemini 1.5 может значительно улучшить производительность модели искусственного интеллекта, уменьшив галлюцинации и значительно повысив точность и способность лучше следовать инструкциям.

Оправдает ли Gemini 1.5 ожидания?

$Why Gemini 1.5\'s One Million Token Context Is a Game Changer$

Если все пойдет по плану, Gemini 1.5 потенциально может превзойти лучшие модели искусственного интеллекта на рынке. Однако, учитывая многочисленные неудачи Google в создании стабильной модели искусственного интеллекта, важно проявить осторожность. Увеличение контекстного окна модели само по себе не делает модель лучше автоматически.

Я использовал контекстное окно размером 200 тысяч в Claude 2.1 в течение нескольких месяцев с момента его выпуска, и мне ясно одно: контекстное окно большего размера действительно может улучшить чувствительность к контексту, но проблемы с производительностью базовой модели могут более широкий контекст — это отдельная проблема.

Сможет ли Google Gemini 1.5 изменить правила игры? Социальные сети в настоящее время заполнены восторженными отзывами о Gemini 1.5 от пользователей раннего доступа. Однако большинство пятизвездочных обзоров основаны на поспешных или упрощенных сценариях использования. Хорошее место, чтобы проверить, как Gemini 1.5 будет работать в реальных условиях, — это технический отчет Google Gemini 1.5 [PDF]. Отчет показывает, что даже во время «контролируемого тестирования» модель не могла получить все мельчайшие детали документов в пределах размера своего контекстного окна.

Контекстное окно в один миллион токенов действительно является впечатляющим техническим достижением, но без возможности надежного получения деталей документа более крупное контекстное окно не имеет практической ценности и может даже стать причиной упадка точность и галлюцинации.

Заявление о выпуске Эта статья воспроизведена по адресу: https://www.makeuseof.com/why-gemini-context-window-is-a-game-changer/. Если есть какие-либо нарушения, свяжитесь с [email protected], чтобы удалить их.

Последний учебник Более>

Алгоритмы разведки роя: три реализации Python
Imagine watching a flock of birds in flight. There's no leader, no one giving directions, yet they swoop and glide together in perfect harmony. It may...

ИИ Опубликовано в 2025-03-24
Как сделать ваш LLM более точным с тряпкой и тонкой настройкой
Imagine studying a module at university for a semester. At the end, after an intensive learning phase, you take an exam – and you can recall th...

ИИ Опубликовано в 2025-03-24
Что такое Google Gemini? Все, что вам нужно знать о конкуренте Google Chatgpt
Google recently released its new Generative AI model, Gemini. It results from a collaborative effort by a range of teams at Google, including members ...

ИИ Опубликовано в 2025-03-23
Руководство по подсказке с DSPY
dspy: декларативная структура для построения и улучшения приложений LLM dspy (декларативные самосовершенствовающие языковые программы) революциониз...

ИИ Опубликовано в 2025-03-22
Автоматизируйте блог в Twitter Thread
эта статья подробно описывает преобразование контента с длинной формой (например, в блогах) в привлечение потоков Twitter с использованием LLM Gemini...

ИИ Опубликовано в 2025-03-11
Искусственная иммунная система (AIS): руководство с примерами Python
В этой статье исследуется искусственная иммунная система (AIS), вычислительные модели, вдохновленные замечательной способностью иммунной системы чело...

ИИ Опубликовано в 2025-03-04
Попробуйте задать ChatGPT эти забавные вопросы о себе
Вы когда-нибудь задумывались, что ChatGPT знает о вас? Как он обрабатывает информацию, которую вы ему передаете с течением времени? Я использовал кучу...

ИИ Опубликовано 22 ноября 2024 г.
Вот как вы все еще можете попробовать загадочного чат-бота GPT-2
Если вам нравятся модели искусственного интеллекта или чат-боты, возможно, вы видели дискуссии о загадочном чат-боте GPT-2 и его эффективности.Здесь м...

ИИ Опубликовано 8 ноября 2024 г.
Режим Canvas в ChatGPT великолепен: 4 способа его использования
Новый режим Canvas в ChatGPT добавил дополнительные возможности к написанию и редактированию в ведущем в мире инструменте генеративного искусственного...

ИИ Опубликовано 8 ноября 2024 г.
Как пользовательские GPT ChatGPT могут раскрыть ваши данные и как обеспечить их безопасность
Пользовательская функция GPT ChatGPT позволяет любому создать собственный инструмент искусственного интеллекта практически для всего, что вы только м...

ИИ Опубликовано 8 ноября 2024 г.
10 способов, которыми ChatGPT может помочь вам найти работу в LinkedIn
Раздел «О программе» вашего профиля LinkedIn, вмещающий 2600 доступных символов, — это отличное место, где можно рассказать о своем опыте, навыках, у...

ИИ Опубликовано 8 ноября 2024 г.
Ознакомьтесь с этими 6 малоизвестными приложениями искусственного интеллекта, которые предоставляют уникальные возможности
На данный момент большинство людей слышали о ChatGPT и Copilot, двух новаторских приложениях для генеративного ИИ, которые возглавили бум ИИ.Но знаете...

ИИ Опубликовано 8 ноября 2024 г.
Эти 7 признаков показывают, что мы уже достигли пика развития искусственного интеллекта
Где бы вы ни посмотрели в Интернете, есть сайты, сервисы и приложения, заявляющие, что использование ИИ делает его лучшим вариантом. Не знаю, как вы, ...

ИИ Опубликовано 8 ноября 2024 г.
4 инструмента обнаружения ChatGPT для проверки искусственного интеллекта для учителей, лекторов и руководителей
По мере того, как ChatGPT становится все более популярным, становится все труднее отличить, что написано человеком, а что создано ИИ. Из-за этого учи...

ИИ Опубликовано 8 ноября 2024 г.
Расширенная голосовая функция ChatGPT распространяется среди большего числа пользователей
Если вы когда-либо хотели провести полноценный разговор с ChatGPT, теперь вы можете это сделать. То есть до тех пор, пока вы платите за право использо...

ИИ Опубликовано 8 ноября 2024 г.