生成式人工智慧聊天機器人的興起使「大語言模型」這個術語變得流行,這是在幕後工作的底層人工智慧技術。大型語言模型 (LLM) 根據一組預測的語言產生輸出,以響應用戶輸入,這使得人工智慧看起來好像能夠獨立思考。
但法學碩士並不是城裡唯一的大型模特兒;大型動作模型(LAM)可能是人工智慧領域的下一個重大事件。
LAM 是一種人工智慧系統,能夠理解人類輸入並執行相應的操作。這與僅專注於產生回應的人工智慧系統的方法略有不同。 「大動作模型」這個術語是由rabbit r1設備的開發商Rabbit Inc.首次提出的。在該公司的rabbit r1發布影片中,該公司表示LAM是一種新的基礎模型,有助於將人工智慧從言語轉化為行動。
LAM 在使用者操作資料的大型資料集上進行訓練;因此,他們透過模仿人類行為或透過演示來學習。透過演示,LAM 可以理解和導航不同網站或行動應用程式的使用者介面,並根據您的指示執行特定操作。根據 Rabbit 的說法,即使介面稍有改變,LAM 也可以實現這一點。
您可以將 LAM 視為 LLM 現有功能的擴充。 LLM 透過預測下一個單字或標記來根據使用者輸入產生文字或媒體輸出(您提出問題,LLM 提供文字或媒體輸出),而 LAM 透過增加代表您執行複雜操作的能力更進一步。
LAM 是代表您執行複雜的操作。然而,需要注意的關鍵點是執行複雜操作的能力。這使得 LAM 在執行高階任務時更有幫助,但這並不意味著它們不能執行更簡單的操作。
從理論上講,這意味著您可以告訴 LAM 代表您做某事,例如從附近的星巴克訂購一杯咖啡、從 Uber 打車,甚至預訂酒店。因此,它不同於執行簡單的任務,例如要求 Google Assistant、Siri 或 Alexa 打開電視或客廳燈。
在幕後,根據 Rabbit Inc. 的願景,LAM 能夠訪問相關網站或 Uber 等應用程序,並通過其界面進行導航以採取行動,例如叫車或取消乘車如果你改變主意。
LAM 的概念令人興奮,甚至可能比 LLM 更令人興奮。 LAM 將成為生成式人工智慧之後的未來,使我們能夠擺脫平凡的任務並專注於其他有成就感的活動。然而,儘管 LAM 看起來令人興奮,但它還沒有準備好。
第一個承諾利用 LAM 的商業產品(兔子 r1)並沒有完全兌現其代表用戶執行操作的行銷承諾。該設備在其核心賣點上表現得非常糟糕,以至於許多第一手評論都認為它毫無用處。
更糟的是,YouTuber Coffeezilla 與一組有權訪問 r1 程式碼庫的精選軟體工程師合作進行的一項調查發現,Rabbit 使用 Playwright 腳本而不是 LAM 來執行操作。因此,它實際上只是運行一堆 If > Then 風格的語句,而不是運行獨特的 AI 模型的設備;與林承諾的相差甚遠。
如果說你可以從 Rabbit 的 r1 設備中獲得什麼的話,那就是願景就在那裡。然而,在實現之前還需要做一些工作,所以先不要興奮。
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3