」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 人工智慧 > 為什麼 Gemini 1.5 的 100 萬代幣上下文會改變遊戲規則

為什麼 Gemini 1.5 的 100 萬代幣上下文會改變遊戲規則

發佈於2024-08-21
瀏覽:487

Google Gemini 1.5 現在配備了一個巨大的 100 萬個代幣上下文窗口,使其在 ChatGPT、Claude 和其他 AI 聊天機器人中的直接競爭對手相形見絀。

這聽起來像是一次大規模升級,可以讓雙子座與眾不同。要全面了解它的範圍有點困難,但雙子座巨大的上下文視窗可能會改變遊戲規則。

什麼是上下文視窗?

在回答您的查詢時,例如解釋概念或總結文本,AI 模型在產生回應時可以考慮的資料量是有限的。它可以考慮的文字大小的限制稱為上下文視窗。

這是另一種看待它的方式。假設您去雜貨店購買雜貨,但沒有雜貨清單。您在購物時記住的雜貨數量的限制是您的上下文視窗。您記住的雜貨越多,不打亂您的購物計劃的機會就越大。同樣,人工智慧模型的上下文視窗越大,模型記住為您提供最佳結果所需的一切的機會就越大。

在撰寫本文時,Anthropic 的 Claude 2.1 的 200k 上下文視窗是任何通用 AI 模型中最大的上下文視窗。其次是具有 128k 上下文視窗的 GPT-4 Turbo。 Google Gemini 1.5 帶來了 100 萬個上下文窗口,是市場上任何產品的四倍。這就引出了一個大問題:一百萬個令牌上下文視窗有什麼大不了的?

為什麼Gemini 1.5 的上下文視窗很重要

Why Gemini 1.5\'s One Million Token Context Is a Game Changer

從更清晰的角度來看,Claude AI 的200k 上下文視窗意味著它可以消化一本大約15 萬字的書,並提供答案。那是巨大的。但 Google 的 Gemini 1.5 一次就能消化 70 萬個單字!

當您將大文本塊輸入 ChatGPT 或 Gemini 等 AI 聊天機器人時,它會嘗試消化盡可能多的文本,但它能消化多少取決於其上下文視窗。因此,如果您的對話在只能處理 28k 字的模型上進行了 100k 字,然後開始提出要求其完全了解整個 100k 字對話的問題,那麼您將使其失敗。

想像一下,一小時長的電影只看了 20 分鐘,卻被要求解釋整部電影。你的結果會有多好?你要嘛拒絕回答,要嘛乾脆編造一些東西,這正是人工智慧聊天機器人會做的事情,導致人工智慧幻覺。

現在,如果您認為您從未需要向聊天機器人輸入 10 萬個單詞,那麼這並不是全部考慮因素。上下文視窗超越了您在單一提示中向 AI 模型提供的文字。人工智慧模型會考慮您在聊天會話期間進行的整個對話,以確保他們的回應盡可能相關。

因此,即使您沒有給它一本 100k 單字的書,您的來回對話和它提供的回應都會添加到上下文視窗計算中。想知道為什麼 ChatGPT 或 Google 的 Gemini 總是忘記你之前在對話中告訴它的事情?它可能耗盡了上下文視窗空間並開始忘記東西。

較大的上下文視窗對於需要深入理解上下文的任務尤其重要,例如總結長文章、回答複雜問題或在生成的文本中保持連貫的敘述。想要寫一本 5 萬字且敘事自始至終一致的小說嗎?想要一個可以「觀看」一小時影片檔案並回答問題的模型嗎?您需要更大的上下文視窗!

簡而言之,Gemini 1.5 更大的上下文視窗可能會顯著提高其 AI 模型的效能,減少幻覺,並顯著提高準確性和更好地遵循指令的能力。

Gemini 1.5能否不負眾望?

Why Gemini 1.5\'s One Million Token Context Is a Game Changer

如果一切按計劃進行,Gemini 1.5 可能會超越市場上最好的人工智慧模型。然而,考慮到谷歌在建立穩定的人工智慧模型方面多次失敗,謹慎行事是很重要的。單獨增加模型的上下文視窗並不會自動使模型變得更好。

自發布以來,我已經使用Claude 2.1 的200k 上下文窗口幾個月了,有一點我很清楚——更大的上下文窗口確實可以提高上下文敏感性,但是核心模型性能的問題可能會導致更大的背景本身就是一個問題。

Google Gemini 1.5 會為我們帶來遊戲規則改變者嗎?目前,社群媒體上充斥著搶先體驗用戶對 Gemini 1.5 的熱烈評論。然而,大多數 5 星級評論都源於倉促或簡化的用例。 Google 的 Gemini 1.5 技術報告 [PDF] 是檢視 Gemini 1.5 在野外表現的好地方。該報告顯示,即使在「受控測試」期間,該模型也無法在其上下文視窗的大小範圍內很好地檢索文件的所有微小細節。

100萬個token上下文窗口確實是一項令人印象深刻的技術壯舉,但是如果不能可靠地檢索文檔的詳細信息,那麼更大的上下文窗口沒有什麼實用價值,甚至可能成為下降的原因準確性和幻覺。

版本聲明 本文轉載於:https://www.makeuseof.com/why-gemini-context-window-is-a-game-changer/如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • 我已經放棄 ChatGPT,轉而選擇這個優越的替代方案:3 個原因
    我已經放棄 ChatGPT,轉而選擇這個優越的替代方案:3 個原因
    讓我們切入正題:我已經從 ChatGPT 切換到 Claude。這並不是說 ChatGPT 不好,而是這樣。但就我的需求而言,克勞德有一些優勢,對我的日常生活產生了真正的影響。 以下是我做出轉變的三個關鍵原因... 1 克勞德實際上明白我在說什麼 我不是完全的人工智慧新手,但我也沒有在業餘時...
    人工智慧 發佈於2024-11-02
  • 如何使用 OpenAI 的 ChatGPT
    如何使用 OpenAI 的 ChatGPT
    除了能够撰写工作电子邮件之外,ChatGPT 还可以为您的演示提供反馈,建议周末旅行的行程,或者在您精力耗尽时集思广益新想法。使用 ChatGPT,您输入请求并按 Enter 键,几秒钟内就会看到响应出现在您面前。 想了解如何使用 ChatGPT?我们已经为您提供了保障。 什么是 ChatGP...
    人工智慧 發佈於2024-11-02
  • GPT-4o 將 GPT-4 帶給每個人,這就是它的工作原理
    GPT-4o 將 GPT-4 帶給每個人,這就是它的工作原理
    那麼,什麼是 GPT-4o? 什麼是 GPT-4o? GPT-4o 是 ChatGPT 開發商 OpenAI 的最新 AI 模型,於 2024 年 5 月初的「春季更新」活動中發布。它將與之前表現最好的模型 GPT-4 Turbo 共存,至少目前如此,並為該工具帶來大量更新。 與其前身不同,...
    人工智慧 發佈於2024-11-02
  • 微軟收購暴雪,探索人工智慧藝術和翻譯 [Podcast]
    微軟收購暴雪,探索人工智慧藝術和翻譯 [Podcast]
    本週的播客回答了這些問題,並仔細考慮了英國政府批准微軟收購動視暴雪的影響。 您可以在 Apple 播客、Spotify、Google 播客、Amazon Music 和 Audible、Player FM 上訂閱真正有用的播客,或將 RSS 來源複製到您的播客播放器中。 Shownotes ...
    人工智慧 發佈於2024-11-01
  • 超越法學碩士:這就是為什麼小語言模型是人工智慧的未來
    超越法學碩士:這就是為什麼小語言模型是人工智慧的未來
    大型语言模型 (LLM) 随着 Open AI 的 ChatGPT 的发布而出现。从那时起,一些公司也推出了他们的法学硕士,但更多的公司现在倾向于小语言模型(SLM)。SLM 正在获得动力,但它们是什么,与法学硕士有何不同? 什么是小语言模型? 小语言模型(SLM)是一种参数较少的人工智能模型(将其...
    人工智慧 發佈於2024-11-01
  • 5 個最佳開源 AI 影像產生器
    5 個最佳開源 AI 影像產生器
    互联网上有数十个免费和开源的人工智能文本到图像生成器,专门用于特定类型的图像。因此,我们筛选了一堆,找到了您现在可以尝试的最佳开源人工智能文本到图像生成器。 1 Craiyon Craiyon 是最容易访问的开源 AI 图像生成器之一。它基于 DALL-E Mini,虽然您可以克隆 Githu...
    人工智慧 發佈於2024-09-02
  • OpenAI 推出自訂 GPT 商店:如何立即存取和使用它
    OpenAI 推出自訂 GPT 商店:如何立即存取和使用它
    OpenAI 終於推出了備受期待的 GPT 商店,為用戶提供一系列由 ChatGPT 社群創建的自訂 GPT,其中包含從寫作和設計到程式設計和生產力的專業聊天機器人。此次發布標誌著 OpenAI 的最新舉措,旨在利用其 AI 創造 ChatGPT 的巨大人氣,ChatGPT 自 2022 年 11...
    人工智慧 發佈於2024-09-02
  • Claude 3 是什麼以及您可以用它做什麼?
    Claude 3 是什麼以及您可以用它做什麼?
    Anthropic 宣布发布 Claude 3——一系列有可能颠覆 GPT-4 的人工智能模型。它具有出色的潜力,但它准备好夺得 ChatGPT 的桂冠了吗? 克劳德 3 是什么? Claude 3 是 Anthropic 开发的三个多模态 AI 模型系列,用于取代其 Claude 2 系列 ...
    人工智慧 發佈於2024-09-01
  • ChatGPT 剛剛新增了一系列新功能:以下是您會關心的功能
    ChatGPT 剛剛新增了一系列新功能:以下是您會關心的功能
    OpenAI 於 2024 年 5 月初進行的 ChatGPT 更新規模龐大,為世界領先的生成式 AI 聊天機器人帶來了大量新功能。大多數改進都集中在增強用戶互動、新功能和提高整體效能上,並且有很多理由讓您應該嘗試一下。 影像輸入與輸出功能 ChatGPT 現在能夠將影像作為輸入並產生影像作為...
    人工智慧 發佈於2024-09-01
  • 用過LLM嗎? LAM 是下一個,但他們需要工作
    用過LLM嗎? LAM 是下一個,但他們需要工作
    生成式人工智慧聊天機器人的興起使「大語言模型」這個術語變得流行,這是在幕後工作的底層人工智慧技術。大型語言模型 (LLM) 根據一組預測的語言產生輸出,以響應用戶輸入,這使得人工智慧看起來好像能夠獨立思考。 但法學碩士並不是城裡唯一的大型模特兒;大型動作模型(LAM)可能是人工智慧領域的下一個重...
    人工智慧 發佈於2024-08-31
  • 使用 ChatGPT 自訂指令的 5 種最佳方法
    使用 ChatGPT 自訂指令的 5 種最佳方法
    ChatGPT 传统上在个性化和内存一致性方面遇到困难。为了解决这个问题,OpenAI 为每个用户引入了免费或付费的自定义指令。 任何人都可以使用 ChatGPT 的自定义指令功能来个性化他们从 ChatGPT 获得的响应,同时确保在所有聊天会话中使用这些指令,并且您可以通过几种不同的方式使用它...
    人工智慧 發佈於2024-08-31
  • ChatGPT 的最新更新可讓您建立完全自訂的 GPT 模型
    ChatGPT 的最新更新可讓您建立完全自訂的 GPT 模型
    OpenAI 的旗艦人工智慧產品 ChatGPT 已經獲得了具有一系列新功能的改變遊戲規則的更新。隨著多項關鍵更新的同時推出,OpenAI 真正寵壞了 ChatGPT 用戶,尤其是 ChatGPT Plus 訂閱者。 有很多內容需要了解,我們不想讓您錯過 — 因此我們探索了最新的 ChatGPT...
    人工智慧 發佈於2024-08-29
  • 為什麼您不應該信任 ChatGPT 來總結您的文本
    為什麼您不應該信任 ChatGPT 來總結您的文本
    ChatGPT 的了解是有限的。它的程式設計迫使它提供你所要求的東西,即使結果是錯誤的。這意味著 ChatGPT 會犯錯,而且它也會犯一些常見的錯誤,尤其是當它在總結資訊而你不注意時。 ChatGPT 可能會忽略或誤解您的提示 如果您向聊天機器人提供大量資料進行排序,即使是複雜的提示,它也可能會...
    人工智慧 發佈於2024-08-29
  • Copilot 與 Copilot Pro:有什麼區別,您應該升級嗎?
    Copilot 與 Copilot Pro:有什麼區別,您應該升級嗎?
    Microsoft Copilot 一直是想要使用 OpenAI 的 ChatGPT Plus 而無需每月付費的人的天堂。 您會很高興聽到這種情況不會很快發生變化,但Microsoft 正在推出Copilot Pro,這是其免費AI 伴侶的新訂閱模型,具有新功能、自訂GPT 支援、並更深入地整合...
    人工智慧 發佈於2024-08-28
  • 如何在 Android 上使用 ChatGPT 小工具
    如何在 Android 上使用 ChatGPT 小工具
    在繼續之前,您需要更新 ChatGPT Android 應用程式 - 如果您使用的是 1.2024.052 之前的任何版本,則無法建立這個方便的主螢幕小工具。目前,ChatGPT 小工具只有一種變體:4x2 選項。 若要新增小部件,請按照以下步驟操作,但請注意,不同裝置的步驟可能略有不同: 解...
    人工智慧 發佈於2024-08-28

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3