用過LLM嗎？ LAM 是下一個，但他們需要工作

首頁 > 人工智慧 > 用過LLM嗎？ LAM 是下一個，但他們需要工作

用過LLM嗎？ LAM 是下一個，但他們需要工作

發佈於2024-08-31

Used an LLM? LAMs Are Coming Next, but They Need Work

生成式人工智慧聊天機器人的興起使「大語言模型」這個術語變得流行，這是在幕後工作的底層人工智慧技術。大型語言模型 (LLM) 根據一組預測的語言產生輸出，以響應用戶輸入，這使得人工智慧看起來好像能夠獨立思考。

但法學碩士並不是城裡唯一的大型模特兒；大型動作模型（LAM）可能是人工智慧領域的下一個重大事件。

什麼是大型行動模式 (LAM)？

LAM 是一種人工智慧系統，能夠理解人類輸入並執行相應的操作。這與僅專注於產生回應的人工智慧系統的方法略有不同。「大動作模型」這個術語是由rabbit r1設備的開發商Rabbit Inc.首次提出的。在該公司的rabbit r1發布影片中，該公司表示LAM是一種新的基礎模型，有助於將人工智慧從言語轉化為行動。

LAM 在使用者操作資料的大型資料集上進行訓練；因此，他們透過模仿人類行為或透過演示來學習。透過演示，LAM 可以理解和導航不同網站或行動應用程式的使用者介面，並根據您的指示執行特定操作。根據 Rabbit 的說法，即使介面稍有改變，LAM 也可以實現這一點。

您可以將 LAM 視為 LLM 現有功能的擴充。 LLM 透過預測下一個單字或標記來根據使用者輸入產生文字或媒體輸出（您提出問題，LLM 提供文字或媒體輸出），而 LAM 透過增加代表您執行複雜操作的能力更進一步。

LAM 可以做什麼？

LAM 是代表您執行複雜的操作。然而，需要注意的關鍵點是執行複雜操作的能力。這使得 LAM 在執行高階任務時更有幫助，但這並不意味著它們不能執行更簡單的操作。

從理論上講，這意味著您可以告訴 LAM 代表您做某事，例如從附近的星巴克訂購一杯咖啡、從 Uber 打車，甚至預訂酒店。因此，它不同於執行簡單的任務，例如要求 Google Assistant、Siri 或 Alexa 打開電視或客廳燈。

在幕後，根據 Rabbit Inc. 的願景，LAM 能夠訪問相關網站或 Uber 等應用程序，並通過其界面進行導航以採取行動，例如叫車或取消乘車如果你改變主意。

LAM 將成功 LLM，但他們還沒有準備好

LAM 的概念令人興奮，甚至可能比 LLM 更令人興奮。 LAM 將成為生成式人工智慧之後的未來，使我們能夠擺脫平凡的任務並專注於其他有成就感的活動。然而，儘管 LAM 看起來令人興奮，但它還沒有準備好。

第一個承諾利用 LAM 的商業產品（兔子 r1）並沒有完全兌現其代表用戶執行操作的行銷承諾。該設備在其核心賣點上表現得非常糟糕，以至於許多第一手評論都認為它毫無用處。

更糟的是，YouTuber Coffeezilla 與一組有權訪問 r1 程式碼庫的精選軟體工程師合作進行的一項調查發現，Rabbit 使用 Playwright 腳本而不是 LAM 來執行操作。因此，它實際上只是運行一堆 If > Then 風格的語句，而不是運行獨特的 AI 模型的設備；與林承諾的相差甚遠。

如果說你可以從 Rabbit 的 r1 設備中獲得什麼的話，那就是願景就在那裡。然而，在實現之前還需要做一些工作，所以先不要興奮。

版本聲明本文轉載於：https://www.makeuseof.com/what-is-a-large-action-model-lam/如有侵犯，請聯絡[email protected]刪除