”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 人工智能 > 为什么 Gemini 1.5 的 100 万代币上下文会改变游戏规则

为什么 Gemini 1.5 的 100 万代币上下文会改变游戏规则

发布于2024-08-21
浏览:943

Google Gemini 1.5 现在配备了一个巨大的 100 万个代币上下文窗口,使其在 ChatGPT、Claude 和其他 AI 聊天机器人中的直接竞争对手相形见绌。

这听起来像是一次大规模升级,可以让双子座与众不同。全面了解它的范围有点困难,但双子座巨大的上下文窗口可能会改变游戏规则。

什么是上下文窗口?

在回答您的查询时,例如解释概念或总结文本,AI 模型在生成响应时可以考虑的数据量是有限的。它可以考虑的文本大小的限制称为上下文窗口。

这是另一种看待它的方式。假设您去杂货店购买杂货,但没有杂货清单。您在购物时记住的杂货数量的限制是您的上下文窗口。您记住的杂货越多,不打乱您的购物计划的机会就越大。同样,人工智能模型的上下文窗口越大,模型记住为您提供最佳结果所需的一切的机会就越大。

在撰写本文时,Anthropic 的 Claude 2.1 的 200k 上下文窗口是任何通用 AI 模型中最大的上下文窗口。其次是具有 128k 上下文窗口的 GPT-4 Turbo。 Google Gemini 1.5 带来了 100 万个上下文窗口,是市场上任何产品的四倍。这就引出了一个大问题:一百万个令牌上下文窗口有什么大不了的?

为什么 Gemini 1.5 的上下文窗口很重要

Why Gemini 1.5\'s One Million Token Context Is a Game Changer

从更清晰的角度来看,Claude AI 的 200k 上下文窗口意味着它可以消化一本大约 15 万字的书,并且提供答案。那是巨大的。但 Google 的 Gemini 1.5 一次就能消化 700,000 个单词!

当您将大文本块输入 ChatGPT 或 Gemini 等 AI 聊天机器人时,它会尝试消化尽可能多的文本,但它能消化多少取决于其上下文窗口。因此,如果您的对话在只能处理 28k 字的模型上进行了 100k 字,然后开始提出要求其完全了解整个 100k 字对话的问题,那么您将使其失败。

想象一下,一部一小时长的电影只看了 20 分钟,却被要求解释整部电影。你的结果会有多好?你要么拒绝回答,要么干脆编造一些东西,这正是人工智能聊天机器人会做的事情,导致人工智能幻觉。

现在,如果您认为您从未需要向聊天机器人输入 10 万个单词,那么这并不是全部考虑因素。上下文窗口超越了您在单个提示中向 AI 模型提供的文本。人工智能模型会考虑您在聊天会话期间进行的整个对话,以确保他们的响应尽可能相关。

因此,即使您没有给它提供一本 100k 单词的书,您的来回对话和它提供的回复都会添加到上下文窗口计算中。想知道为什么 ChatGPT 或 Google 的 Gemini 总是忘记你之前在对话中告诉它的事情?它可能耗尽了上下文窗口空间并开始忘记东西。

较大的上下文窗口对于需要深入理解上下文的任务尤其重要,例如总结长文章、回答复杂问题或在生成的文本中保持连贯的叙述。想要写一本 5 万字且叙事自始至终一致的小说吗?想要一个可以“观看”一小时视频文件并回答问题的模型吗?您需要更大的上下文窗口!

简而言之,Gemini 1.5 更大的上下文窗口可能会显着提高其 AI 模型的性能,减少幻觉,并显着提高准确性和更好地遵循指令的能力。

Gemini 1.5能否不负众望?

Why Gemini 1.5\'s One Million Token Context Is a Game Changer

如果一切按计划进行,Gemini 1.5 可能会超越市场上最好的人工智能模型。然而,考虑到谷歌在构建稳定的人工智能模型方面多次失败,谨慎行事是很重要的。单独增加模型的上下文窗口并不会自动使模型变得更好。

自发布以来,我已经使用 Claude 2.1 的 200k 上下文窗口几个月了,有一点我很清楚——更大的上下文窗口确实可以提高上下文敏感性,但是核心模型性能的问题可能会导致更大的背景本身就是一个问题。

Google Gemini 1.5 会给我们带来游戏规则改变者吗?目前,社交媒体上充斥着抢先体验用户对 Gemini 1.5 的热烈评论。然而,大多数 5 星级评论都源于仓促或简化的用例。 Google 的 Gemini 1.5 技术报告 [PDF] 是检查 Gemini 1.5 在野外表现的好地方。该报告显示,即使在“受控测试”期间,该模型也无法在其上下文窗口的大小范围内很好地检索文档的所有微小细节。

100万个token上下文窗口确实是一项令人印象深刻的技术壮举,但是如果不能可靠地检索文档的详细信息,那么更大的上下文窗口没有什么实用价值,甚至可能成为下降的原因准确性和幻觉。

版本声明 本文转载于:https://www.makeuseof.com/why-gemini-context-window-is-a-game-changer/如有侵犯,请联系[email protected]删除
最新教程 更多>
  • 我已经放弃 ChatGPT,转而选择这个优越的替代方案:3 个原因
    我已经放弃 ChatGPT,转而选择这个优越的替代方案:3 个原因
    让我们切入正题:我已经从 ChatGPT 切换到 Claude。这并不是说 ChatGPT 不好,而是这样。但就我的需求而言,克劳德有一些优势,对我的日常生活产生了真正的影响。 以下是我做出转变的三个关键原因... 1 克劳德实际上明白我在说什么 我不是完全的人工智能新手,但我也没有在业余...
    人工智能 发布于2024-11-02
  • 如何使用 OpenAI 的 ChatGPT
    如何使用 OpenAI 的 ChatGPT
    除了能够撰写工作电子邮件之外,ChatGPT 还可以为您的演示提供反馈,建议周末旅行的行程,或者在您精力耗尽时集思广益新想法。使用 ChatGPT,您输入请求并按 Enter 键,几秒钟内就会看到响应出现在您面前。 想了解如何使用 ChatGPT?我们已经为您提供了保障。 什么是 ChatGP...
    人工智能 发布于2024-11-02
  • GPT-4o 将 GPT-4 带给每个人,这就是它的工作原理
    GPT-4o 将 GPT-4 带给每个人,这就是它的工作原理
    那么,什么是 GPT-4o? 什么是 GPT-4o? GPT-4o 是 ChatGPT 开发商 OpenAI 的最新 AI 模型,于 2024 年 5 月上旬的“春季更新”活动中发布。它将与之前表现最好的模型 GPT-4 Turbo 共存,至少目前如此,并为该工具带来大量更新。 与其前身不同...
    人工智能 发布于2024-11-02
  • 微软收购暴雪,探索人工智能艺术和翻译 [播客]
    微软收购暴雪,探索人工智能艺术和翻译 [播客]
    本周的播客回答了这些问题,并仔细考虑了英国政府批准微软收购动视暴雪的影响。 您可以在 Apple 播客、Spotify、Google 播客、Amazon Music 和 Audible、Player FM 上订阅真正有用的播客,或将 RSS 源复制到您的播客播放器中。 Shownotes ...
    人工智能 发布于2024-11-01
  • 超越法学硕士:这就是为什么小语言模型是人工智能的未来
    超越法学硕士:这就是为什么小语言模型是人工智能的未来
    大型语言模型 (LLM) 随着 Open AI 的 ChatGPT 的发布而出现。从那时起,一些公司也推出了他们的法学硕士,但更多的公司现在倾向于小语言模型(SLM)。SLM 正在获得动力,但它们是什么,与法学硕士有何不同? 什么是小语言模型? 小语言模型(SLM)是一种参数较少的人工智能模型(将其...
    人工智能 发布于2024-11-01
  • ChatGPT 的自定义 GPT 如何暴露您的数据以及如何保证其安全
    ChatGPT 的自定义 GPT 如何暴露您的数据以及如何保证其安全
    ChatGPT 的自定义 GPT 功能允许任何人为几乎任何你能想到的东西创建自定义 AI 工具;创意、技术、游戏、定制 GPT 都可以做到。更好的是,您可以与任何人分享您的自定义 GPT 创建。 但是,通过共享您的自定义 GPT,您可能会犯一个代价高昂的错误,将您的数据暴露给全球数千人。 什么...
    人工智能 发布于2024-10-08
  • 查看这 6 个鲜为人知的 AI 应用程序,它们可提供独特的体验
    查看这 6 个鲜为人知的 AI 应用程序,它们可提供独特的体验
    目前,大多数人都听说过 ChatGPT 和 Copilot,这两款引领 AI 热潮的开创性生成式 AI 应用程序。但是您知道吗,大量鲜为人知的 AI 工具可以提供精彩的、独特的经历?这里有六个最好的。 1 Ditto Music Ditto 不是您可以用来创建独特歌曲的众多 AI 音乐生成器之一,而...
    人工智能 发布于2024-10-05
  • 您可以免费试用的 6 个 OpenAI Sora 替代方案
    您可以免费试用的 6 个 OpenAI Sora 替代方案
    Runway 的 Gen-2 最好地反映了使用 Open AI 的 Sora 所获得的效果,使用多模式 AI 系统通过文本提示生成视频剪辑。 Runway 的 Gen-2 功能包括上传图像或视频的功能,以用作您想要生成的视频剪辑的参考。 Open AI 的 Sora 是否也支持从参考图像或剪辑创...
    人工智能 发布于2024-10-01
  • 如何使用 Nightshade 保护您的艺术品免受生成人工智能的影响
    如何使用 Nightshade 保护您的艺术品免受生成人工智能的影响
    人工智能工具是革命性的,现在可以进行对话,生成类似人类的文本,并根据单个单词创建图像。然而,这些人工智能工具使用的训练数据通常来自受版权保护的来源,特别是当涉及到 DALL-E、Midjourney 等文本到图像生成器时。 阻止生成式人工智能工具使用版权图像进行训练是很困难的,各行各业的艺术家都...
    人工智能 发布于2024-09-19
  • 如何使用 ChatGPT 的“我的 GPT”机器人来学习棋盘游戏、创建图像等等
    如何使用 ChatGPT 的“我的 GPT”机器人来学习棋盘游戏、创建图像等等
    OpenAI 刚刚发布了一系列新的 ChatGPT 模式,称为“我的 GPT”。这本质上为 ChatGPT-4 和 DALL-E 增添了风味,使它们专门适合某些任务。 您将在 ChatGPT 侧面菜单的“探索”选项卡中找到“我的 GPT”。它充满了自定义 GPT 模式,从有趣的模因翻译器到技术支...
    人工智能 发布于2024-09-18
  • 为什么 ChatGPT 的语音转文本功能是我用过的最好的
    为什么 ChatGPT 的语音转文本功能是我用过的最好的
    你必须说出来才相信;这就是 ChatGPT 出色的语音转文本功能。事实证明,它比一些最成熟的语音转文本应用程序更加流畅和精确。 ChatGPT 比 Google 的语音输入更好 Google 的语音输入是我断断续续使用多年的工具。它配备了 SwiftKey 键盘应用程序和 Google 自己的...
    人工智能 发布于2024-09-15
  • ChatGPT Plus 的优点和缺点
    ChatGPT Plus 的优点和缺点
    ChatGPT 自面世以来就取得了巨大的成功。 ChatGPT 背后的公司 OpenAI 很快推出了付费版本 ChatGPT Plus,以通过该服务货币化,因为运行它需要花钱,而且几乎每个人都使用它。 高级版在发布时就受到了很多炒作,因为它让订阅者可以优先访问最新版本的 OpenAI 语言模型 ...
    人工智能 发布于2024-09-13
  • 如何隐藏您的 ChatGPT 对话而不删除它们
    如何隐藏您的 ChatGPT 对话而不删除它们
    您与 ChatGPT 的某些对话可能比其他对话更加私密。幸运的是,OpenAI 可以轻松存档您的聊天记录并将对话隐藏起来。无论您在网络上还是在智能手机上使用 ChatGPT,隐藏这些 AI 聊天都很简单。 如何在网络上隐藏 ChatGPT 聊天 ChatGPT 具有存档功能,只需单击几下即可从...
    人工智能 发布于2024-09-04
  • 什么是预测人工智能,它是如何工作的?
    什么是预测人工智能,它是如何工作的?
    你可能听说过生成式人工智能,但是你对预测式人工智能了解多少?它们听起来很相似,但有一些关键的区别,以及您可能已经在使用它的多种方式! 什么是预测人工智能,它是如何工作的? 预测人工智能使用已经发生的事情的信息来对未来可能发生的事情进行预测和预测。要成功使用,它需要获得人类的高质量数据和主题专业...
    人工智能 发布于2024-09-03
  • 10 个真正让 ChatGPT 变得更好的自定义 GPT
    10 个真正让 ChatGPT 变得更好的自定义 GPT
    ChatGPT 本身很棒,但您知道可以使用自定义 GPT 来简化其功能吗?自定义 GPT 可以教您如何编码、计划旅行、转录视频等等,并且有大量可供您选择。 因此,这里是最好的自定义 GPT,它们实际上使 ChatGPT 成为适合任何情况的更好工具。 1 图表:展示 图表:展示 GPT 插件可以...
    人工智能 发布于2024-09-03

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3