」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 人工智慧 > 為什麼 Gemini 1.5 的 100 萬代幣上下文會改變遊戲規則

為什麼 Gemini 1.5 的 100 萬代幣上下文會改變遊戲規則

發佈於2024-08-21
瀏覽:904

Google Gemini 1.5 現在配備了一個巨大的 100 萬個代幣上下文窗口,使其在 ChatGPT、Claude 和其他 AI 聊天機器人中的直接競爭對手相形見絀。

這聽起來像是一次大規模升級,可以讓雙子座與眾不同。要全面了解它的範圍有點困難,但雙子座巨大的上下文視窗可能會改變遊戲規則。

什麼是上下文視窗?

在回答您的查詢時,例如解釋概念或總結文本,AI 模型在產生回應時可以考慮的資料量是有限的。它可以考慮的文字大小的限制稱為上下文視窗。

這是另一種看待它的方式。假設您去雜貨店購買雜貨,但沒有雜貨清單。您在購物時記住的雜貨數量的限制是您的上下文視窗。您記住的雜貨越多,不打亂您的購物計劃的機會就越大。同樣,人工智慧模型的上下文視窗越大,模型記住為您提供最佳結果所需的一切的機會就越大。

在撰寫本文時,Anthropic 的 Claude 2.1 的 200k 上下文視窗是任何通用 AI 模型中最大的上下文視窗。其次是具有 128k 上下文視窗的 GPT-4 Turbo。 Google Gemini 1.5 帶來了 100 萬個上下文窗口,是市場上任何產品的四倍。這就引出了一個大問題:一百萬個令牌上下文視窗有什麼大不了的?

為什麼Gemini 1.5 的上下文視窗很重要

Why Gemini 1.5\'s One Million Token Context Is a Game Changer

從更清晰的角度來看,Claude AI 的200k 上下文視窗意味著它可以消化一本大約15 萬字的書,並提供答案。那是巨大的。但 Google 的 Gemini 1.5 一次就能消化 70 萬個單字!

當您將大文本塊輸入 ChatGPT 或 Gemini 等 AI 聊天機器人時,它會嘗試消化盡可能多的文本,但它能消化多少取決於其上下文視窗。因此,如果您的對話在只能處理 28k 字的模型上進行了 100k 字,然後開始提出要求其完全了解整個 100k 字對話的問題,那麼您將使其失敗。

想像一下,一小時長的電影只看了 20 分鐘,卻被要求解釋整部電影。你的結果會有多好?你要嘛拒絕回答,要嘛乾脆編造一些東西,這正是人工智慧聊天機器人會做的事情,導致人工智慧幻覺。

現在,如果您認為您從未需要向聊天機器人輸入 10 萬個單詞,那麼這並不是全部考慮因素。上下文視窗超越了您在單一提示中向 AI 模型提供的文字。人工智慧模型會考慮您在聊天會話期間進行的整個對話,以確保他們的回應盡可能相關。

因此,即使您沒有給它一本 100k 單字的書,您的來回對話和它提供的回應都會添加到上下文視窗計算中。想知道為什麼 ChatGPT 或 Google 的 Gemini 總是忘記你之前在對話中告訴它的事情?它可能耗盡了上下文視窗空間並開始忘記東西。

較大的上下文視窗對於需要深入理解上下文的任務尤其重要,例如總結長文章、回答複雜問題或在生成的文本中保持連貫的敘述。想要寫一本 5 萬字且敘事自始至終一致的小說嗎?想要一個可以「觀看」一小時影片檔案並回答問題的模型嗎?您需要更大的上下文視窗!

簡而言之,Gemini 1.5 更大的上下文視窗可能會顯著提高其 AI 模型的效能,減少幻覺,並顯著提高準確性和更好地遵循指令的能力。

Gemini 1.5能否不負眾望?

Why Gemini 1.5\'s One Million Token Context Is a Game Changer

如果一切按計劃進行,Gemini 1.5 可能會超越市場上最好的人工智慧模型。然而,考慮到谷歌在建立穩定的人工智慧模型方面多次失敗,謹慎行事是很重要的。單獨增加模型的上下文視窗並不會自動使模型變得更好。

自發布以來,我已經使用Claude 2.1 的200k 上下文窗口幾個月了,有一點我很清楚——更大的上下文窗口確實可以提高上下文敏感性,但是核心模型性能的問題可能會導致更大的背景本身就是一個問題。

Google Gemini 1.5 會為我們帶來遊戲規則改變者嗎?目前,社群媒體上充斥著搶先體驗用戶對 Gemini 1.5 的熱烈評論。然而,大多數 5 星級評論都源於倉促或簡化的用例。 Google 的 Gemini 1.5 技術報告 [PDF] 是檢視 Gemini 1.5 在野外表現的好地方。該報告顯示,即使在「受控測試」期間,該模型也無法在其上下文視窗的大小範圍內很好地檢索文件的所有微小細節。

100萬個token上下文窗口確實是一項令人印象深刻的技術壯舉,但是如果不能可靠地檢索文檔的詳細信息,那麼更大的上下文窗口沒有什麼實用價值,甚至可能成為下降的原因準確性和幻覺。

版本聲明 本文轉載於:https://www.makeuseof.com/why-gemini-context-window-is-a-game-changer/如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • 盤點Top 5 AI智能預算工具
    盤點Top 5 AI智能預算工具
    通過AI解鎖財務自由:印度的最高預算應用程序 您是否厭倦了不斷想知道您的錢去了哪裡? 賬單似乎會吞噬您的收入嗎? 人工智能(AI)提供了強大的解決方案。 AI預算工具提供實時財務見解,個性化建議和動態計劃,使資金管理更簡單,更準確。 有些甚至使用生成AI提供基於聊天的財務分析!本文探討了印度可...
    人工智慧 發佈於2025-04-17
  • Excel SUMPRODUCT函數詳解 - 數據分析學院
    Excel SUMPRODUCT函數詳解 - 數據分析學院
    Excel的SumProduct函數:數據分析PowerHouse 解鎖Excel的Sumproduct函數的功能,以用於簡化數據分析。這種多功能功能毫不費力地結合了求和功能,擴展到跨相應範圍或數組的加法,減法和分裂。 無論您是分析趨勢還是解決複雜的計算,Sumproduct都會將數字轉換為可...
    人工智慧 發佈於2025-04-16
  • 深度研究全面開放,ChatGPT Plus用戶福利
    深度研究全面開放,ChatGPT Plus用戶福利
    Openai的深入研究:改變遊戲的AI研究 Openai已為所有Chatgpt加上訂戶釋放了深入的研究,並承諾在研究效率方面具有重大提高。 在測試了雙子座,Grok 3和困惑等競爭對手的類似功能之後,我可以自信地將Openai的深入研究宣佈為出色的選擇。此博客深入研究了它的功能。 目錄 什麼是...
    人工智慧 發佈於2025-04-16
  • 亞馬遜Nova Today真實體驗與評測 - Analytics Vidhya
    亞馬遜Nova Today真實體驗與評測 - Analytics Vidhya
    亚马逊最近的回复:Invent 2024活动展示了Nova,这是其最先进的基础模型套件,旨在彻底改变AI和内容创建。本文深入研究了Nova的架构,通过动手实例探索其功能,并检查基准结果。 我们将介绍功能,评论,基准和对AI应用程序的影响。 [2 此探索将涵盖Amazon Nova的功能,详细的评论...
    人工智慧 發佈於2025-04-16
  • ChatGPT定時任務功能的5種使用方法
    ChatGPT定時任務功能的5種使用方法
    Chatgpt的新計劃任務:使用AI 自動化您的一天 Chatgpt最近引入了一個改變遊戲規則的功能:計劃的任務。 這允許用戶自動化重複提示,即使在離線時,也可以在預定時間接收通知或響應。想像一下每天策劃的新聞通訊,自動化工作時間表或及時的習慣提醒 - 所有這些都是由Chatgpt自動處理的。...
    人工智慧 發佈於2025-04-16
  • 三款AI聊機器人對同一提示的反應,哪個最佳?
    三款AI聊機器人對同一提示的反應,哪個最佳?
    這是我發現的。 在精心策劃且詳細的提示中扮演著質量良好的提示,在輸出的質量中扮演任何cathbot生產的質量。與所有工具一樣,輸出僅與使用該工具的人的技能一樣好。 AI聊天機器人沒有什麼不同。 有了這種理解,我指示每個模型創建一個針對個人理財的基本指南。這種方法使我能夠評估多個相互聯繫的主題(特...
    人工智慧 發佈於2025-04-15
  • ChatGPT足矣,無需專用AI聊機
    ChatGPT足矣,無需專用AI聊機
    在一個新的AI聊天機器人每天啟動的世界中,決定哪一個是正確的“一個”。但是,以我的經驗,chatgpt處理了我所丟下的幾乎所有內容,而無需在平台之間切換,只需稍有及時的工程。 在許多實踐應用程序中可能會讓您感到驚訝。它的範圍令人印象深刻,使用戶可以生成代碼段,草稿求職信,甚至翻譯語言。這種多功能性...
    人工智慧 發佈於2025-04-14
  • 印度AI時刻:與中美在生成AI領域競賽
    印度AI時刻:與中美在生成AI領域競賽
    印度的AI抱負:2025 Update 與中國和美國在生成AI上進行了大量投資,印度正在加快自己的Genai計劃。 不可否認的是,迫切需要迎合印度各種語言和文化景觀的土著大語模型(LLM)和AI工具。 本文探討了印度新興的Genai生態系統,重點介紹了2025年工會預算,公司參與,技能開發計劃...
    人工智慧 發佈於2025-04-13
  • 使用Airflow和Docker自動化CSV到PostgreSQL的導入
    使用Airflow和Docker自動化CSV到PostgreSQL的導入
    本教程演示了使用Apache氣流,Docker和PostgreSQL構建強大的數據管道,以使數據傳輸從CSV文件自動化到數據庫。 我們將介紹有效工作流程管理的核心氣流概念,例如DAG,任務和操作員。 該項目展示了創建可靠的數據管道,該數據管線讀取CSV數據並將其寫入PostgreSQL數據庫。我們...
    人工智慧 發佈於2025-04-12
  • 群智能算法:三個Python實現
    群智能算法:三個Python實現
    Imagine watching a flock of birds in flight. There's no leader, no one giving directions, yet they swoop and glide together in perfect harmony. It may...
    人工智慧 發佈於2025-03-24
  • 如何通過抹布和微調使LLM更準確
    如何通過抹布和微調使LLM更準確
    Imagine studying a module at university for a semester. At the end, after an intensive learning phase, you take an exam – and you can recall th...
    人工智慧 發佈於2025-03-24
  • 什麼是Google Gemini?您需要了解的有關Google Chatgpt競爭對手的一切
    什麼是Google Gemini?您需要了解的有關Google Chatgpt競爭對手的一切
    Google recently released its new Generative AI model, Gemini. It results from a collaborative effort by a range of teams at Google, including members ...
    人工智慧 發佈於2025-03-23
  • 與DSPY提示的指南
    與DSPY提示的指南
    DSPY(聲明性的自我改善語言程序)通過抽象及時工程的複雜性來徹底改變LLM應用程序的開發。 本教程提供了使用DSPY的聲明方法來構建強大的AI應用程序的綜合指南。 [2 抓取DSPY的聲明方法,用於簡化LLM應用程序開發。 了解DSPY如何自動化提示工程並優化複雜任務的性能。 探索實用的D...
    人工智慧 發佈於2025-03-22
  • 自動化博客到Twitter線程
    自動化博客到Twitter線程
    本文详细介绍了使用Google的Gemini-2.0 LLM,Chromadb和Shiplit自动化长效内容的转换(例如博客文章)。 手动线程创建耗时;此应用程序简化了该过程。 [2 [2 使用Gemini-2.0,Chromadb和Shatlit自动化博客到twitter线程转换。 获得实用的经...
    人工智慧 發佈於2025-03-11
  • 人工免疫系統(AIS):python示例的指南
    人工免疫系統(AIS):python示例的指南
    本文探討了人造免疫系統(AIS),這是受人類免疫系統識別和中和威脅的非凡能力啟發的計算模型。 我們將深入研究AIS的核心原理,檢查諸如克隆選擇,負面選擇和免疫網絡理論之類的關鍵算法,並用Python代碼示例說明其應用。 [2 抗體:識別並結合特定威脅(抗原)。在AIS中,這些代表了問題的潛在解決方...
    人工智慧 發佈於2025-03-04

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3