」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 人工智慧 > 超越法學碩士:這就是為什麼小語言模型是人工智慧的未來

超越法學碩士:這就是為什麼小語言模型是人工智慧的未來

發佈於2024-11-01
瀏覽:273

大型语言模型 (LLM) 随着 Open AI 的 ChatGPT 的发布而出现。从那时起,一些公司也推出了他们的法学硕士,但更多的公司现在倾向于小语言模型(SLM)。

SLM 正在获得动力,但它们是什么,与法学硕士有何不同?

什么是小语言模型?

小语言模型(SLM)是一种参数较少的人工智能模型(将其视为训练期间学习的模型中的值)。与大型同类产品一样,SLM 可以生成文本并执行其他任务。然而,SLM 使用较少的数据集进行训练,参数较少,并且需要较少的计算能力来训练和运行。

SLM 专注于关键功能,其占用空间小意味着它们可以部署在不同的设备上,包括那些没有移动设备等高端硬件。例如,Google 的 Nano 是一个从头开始构建的设备上 SLM,可在移动设备上运行。据该公司称,由于尺寸较小,Nano 可以在有或没有网络连接的情况下在本地运行。

Beyond LLMs: Here\'s Why Small Language Models Are the Future of AI

除了 Nano 之外,还有许多来自人工智能领域领先和新兴公司的其他 SLM。一些流行的 SLM 包括 Microsoft 的 Phi-3、OpenAI 的 GPT-4o mini、Anthropic 的 Claude 3 Haiku、Meta 的 Llama 3 和 Mistral AI 的 Mixtral 8x7B。

还有其他选项,您可能认为是 LLM,但实际上它们是SLM。考虑到大多数公司正在采用多模型方法,在其产品组合中发布不止一种语言模型,同时提供 LLM 和 SLM,这一点尤其正确。一个例子是 GPT-4,它有多种模型,包括 GPT-4、GPT-4o (Omni) 和 GPT-4o mini。

小语言模型与大语言模型

在讨论 SLM 时,我们不能忽视它们的重要对手:LLM。 SLM 和 LLM 之间的主要区别在于模型大小,它是根据参数来衡量的。

截至撰写本文时,AI 行业对于模型不应包含的最大参数数量尚未达成共识超过被视为 SLM 或被视为 LLM 所需的最低数量。然而,SLM 通常有数百万到数十亿个参数,而 LLM 的参数更多,高达数万亿个。

例如,2020 年发布的 GPT-3 有 1750 亿个参数(并且据传 GPT-4 模型约有 1.76 万亿个参数),而微软 2024 年的 Phi-3-mini、Phi-3-small 和 Phi-3-medium SLM 分别测量了 3.8、7 和 140 亿个参数。

Beyond LLMs: Here\'s Why Small Language Models Are the Future of AI

SLM 和 LLM 之间的另一个区别因素是用于培训的数据量。 SLM 使用少量数据进行训练,而 LLM 使用大型数据集。这种差异也会影响模型解决复杂任务的能力。

由于训练中使用的数据量很大,LLM 更适合解决需要高级推理的不同类型的复杂任务,而 SLM 更适合解决更简单的任务任务。与 LLM 不同,SLM 使用较少的训练数据,但所使用的数据必须具有更高的质量,才能在一个小包中实现 LLM 中的许多功能。

为什么小语言模型是未来

对于大多数用例,SLM 更适合成为公司和消费者用来执行各种任务的主流模型。当然,法学硕士有其优势,并且更适合某些用例,例如解决复杂的任务。然而,由于以下原因,SLM 是大多数用例的未来。

1. 较低的培训和维护成本

Beyond LLMs: Here\'s Why Small Language Models Are the Future of AI

SLM 比 LLM 需要更少的训练数据,这使得它们对于培训数据、财务或两者都有限的个人和中小型公司来说,这是最可行的选择。 LLM 需要大量的训练数据,进而需要大量的计算资源来训练和运行。

为了正确看待这一点,OpenAI 的首席执行官 Sam Altman 证实,他们的训练花费了超过 1 亿美元GPT-4 在麻省理工学院的一次活动中发表讲话(据《连线》报道)。另一个例子是 Meta 的 OPT-175B LLM。 Meta 表示,它是使用 992 个 NVIDIA A100 80GB GPU 进行训练的,据 CNBC 报道,每个 GPU 的成本约为 10,000 美元。这样一来,成本约为900万美元,还不包括能源、工资等其他费用。

按照这样的数字,中小型公司培养法学硕士是不可行的。相比之下,SLM 在资源方面的进入门槛较低,运行成本也较低,因此,更多的公司会接受它们。

2. 更好的性能

Beyond LLMs: Here\'s Why Small Language Models Are the Future of AI

性能是另一个因素SLM 因其紧凑的规模而击败 LLM 的领域。 SLM 的延迟更短,更适合需要更快响应的场景,例如实时应用程序。例如,在数字助理等语音响应系统中,更快的响应是首选。

在设备上运行(稍后详细介绍)也意味着您的请求不必访问在线服务器并返回到响应您的查询,从而获得更快的响应。

3. 更准确

Beyond LLMs: Here\'s Why Small Language Models Are the Future of AI

说到生成人工智能,有一件事保持不变:垃圾输入,垃圾输出。目前的法学硕士已经使用原始互联网数据的大型数据集进行了培训。因此,它们可能并不在所有情况下都是准确的。这是 ChatGPT 和类似模型的问题之一,也是为什么你不应该相信人工智能聊天机器人所说的一切。另一方面,SLM 使用比 LLM 更高质量的数据进行训练,因此具有更高的准确性。

SLM 还可以通过针对特定任务或领域的集中训练来进一步微调,从而在这些方面获得更高的准确性与更大、更通用的模型相比。

4. 可以在设备上运行

Beyond LLMs: Here\'s Why Small Language Models Are the Future of AI

SLM 需要的计算能力比 LLM 更少,因此非常适合边缘计算案例。它们可以部署在智能手机和自动驾驶汽车等边缘设备上,这些设备没有大量的计算能力或资源。谷歌的 Nano 模型可以在设备上运行,即使没有有效的互联网连接也可以工作。

这种能力为公司和消费者带来了双赢的局面。首先,这是隐私的胜利,因为用户数据是在本地处理而不是发送到云端,这一点很重要,因为更多的人工智能被集成到我们的智能手机中,几乎包含了我们的所有细节。这对公司来说也是一场胜利,因为他们不需要部署和运行大型服务器来处理人工智能任务。

SLM 正在获得动力,其中最大的行业参与者,如 Open AI、谷歌、微软、 Anthropic 和 Meta 发布了此类模型。这些模型更适合更简单的任务,这也是我们大多数人使用法学硕士的目的;因此,他们是未来。

但法学硕士不会去任何地方。相反,它们将用于结合不同领域的信息来创建新事物的高级应用程序,例如医学研究。

版本聲明 本文轉載於:https://www.makeuseof.com/why-small-language-models-are-the-future-of-ai/如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • 群智能算法:三個Python實現
    群智能算法:三個Python實現
    Imagine watching a flock of birds in flight. There's no leader, no one giving directions, yet they swoop and glide together in perfect harmony. It may...
    人工智慧 發佈於2025-03-24
  • 如何通過抹布和微調使LLM更準確
    如何通過抹布和微調使LLM更準確
    Imagine studying a module at university for a semester. At the end, after an intensive learning phase, you take an exam – and you can recall th...
    人工智慧 發佈於2025-03-24
  • 什麼是Google Gemini?您需要了解的有關Google Chatgpt競爭對手的一切
    什麼是Google Gemini?您需要了解的有關Google Chatgpt競爭對手的一切
    Google recently released its new Generative AI model, Gemini. It results from a collaborative effort by a range of teams at Google, including members ...
    人工智慧 發佈於2025-03-23
  • 與DSPY提示的指南
    與DSPY提示的指南
    DSPY(聲明性的自我改善語言程序)通過抽象及時工程的複雜性來徹底改變LLM應用程序的開發。 本教程提供了使用DSPY的聲明方法來構建強大的AI應用程序的綜合指南。 [2 抓取DSPY的聲明方法,用於簡化LLM應用程序開發。 了解DSPY如何自動化提示工程並優化複雜任務的性能。 探索實用的D...
    人工智慧 發佈於2025-03-22
  • 自動化博客到Twitter線程
    自動化博客到Twitter線程
    本文详细介绍了使用Google的Gemini-2.0 LLM,Chromadb和Shiplit自动化长效内容的转换(例如博客文章)。 手动线程创建耗时;此应用程序简化了该过程。 [2 [2 使用Gemini-2.0,Chromadb和Shatlit自动化博客到twitter线程转换。 获得实用的经...
    人工智慧 發佈於2025-03-11
  • 人工免疫系統(AIS):python示例的指南
    人工免疫系統(AIS):python示例的指南
    本文探討了人造免疫系統(AIS),這是受人類免疫系統識別和中和威脅的非凡能力啟發的計算模型。 我們將深入研究AIS的核心原理,檢查諸如克隆選擇,負面選擇和免疫網絡理論之類的關鍵算法,並用Python代碼示例說明其應用。 [2 抗體:識別並結合特定威脅(抗原)。在AIS中,這些代表了問題的潛在解決方...
    人工智慧 發佈於2025-03-04
  • 試著向 ChatGPT 詢問這些關於您自己的有趣問題
    試著向 ChatGPT 詢問這些關於您自己的有趣問題
    有没有想过 ChatGPT 了解您的哪些信息?随着时间的推移,它如何处理您提供给它的信息?我在不同的场景中使用过 ChatGPT 堆,在特定的交互后看看它会说什么总是很有趣。✕ 删除广告 所以,为什么不尝试向 ChatGPT 询问其中一些问题来看看它对你的真实看法是什么? 我理想生活中的...
    人工智慧 發佈於2024-11-22
  • 您仍然可以透過以下方式嘗試神秘的 GPT-2 聊天機器人
    您仍然可以透過以下方式嘗試神秘的 GPT-2 聊天機器人
    如果您對人工智慧模型或聊天機器人感興趣,您可能已經看過有關神秘的 GPT-2 聊天機器人及其有效性的討論。 在這裡,我們解釋什麼是 GPT-2 聊天機器人以及如何使用存取它。 什麼是 GPT-2 聊天機器人? 2024年4月下旬,一個名為gpt2-chatbot的神秘AI模型在LLM測試和基準測試...
    人工智慧 發佈於2024-11-08
  • ChatGPT 的 Canvas 模式很棒:有 4 種使用方法
    ChatGPT 的 Canvas 模式很棒:有 4 種使用方法
    ChatGPT 的新 Canvas 模式為世界領先的生成式 AI 工具中的寫作和編輯增添了額外的維度。自從 ChatGPT Canvas 推出以來,我一直在使用它,並找到了幾種不同的方法來使用這個新的 AI 工具。 ✕ 刪除廣告 1 文本編輯 ChatGPT Canvas 是如果你想編輯...
    人工智慧 發佈於2024-11-08
  • ChatGPT 的自訂 GPT 如何暴露您的資料以及如何確保其安全
    ChatGPT 的自訂 GPT 如何暴露您的資料以及如何確保其安全
    ChatGPT 的自訂 GPT 功能允許任何人為幾乎任何你能想到的東西創建自訂 AI 工具;創意、技術、遊戲、自訂 GPT 都可以做到。更好的是,您可以與任何人分享您的自訂 GPT 創建。 但是,透過分享您的自訂 GPT,您可能會犯下一個代價高昂的錯誤,將您的資料暴露給全球數千人。 什麼是自訂...
    人工智慧 發佈於2024-11-08
  • ChatGPT 可協助您在 LinkedIn 上找到工作的 10 種方式
    ChatGPT 可協助您在 LinkedIn 上找到工作的 10 種方式
    LinkedIn 个人资料的“关于”部分有 2,600 个可用字符,是阐述您的背景、技能、热情和未来目标的绝佳空间。查看您的 LinkedIn 简历,作为您的专业背景、技能和抱负的简明摘要。 向 ChatGPT 提供您所有获胜品质的列表,或将您的简历复制粘贴到其中。要求聊天机器人使用这些信息撰写...
    人工智慧 發佈於2024-11-08
  • 查看這 6 個鮮為人知的 AI 應用程序,它們可提供獨特的體驗
    查看這 6 個鮮為人知的 AI 應用程序,它們可提供獨特的體驗
    目前,大多数人都听说过 ChatGPT 和 Copilot,这两款引领 AI 热潮的开创性生成式 AI 应用程序。但是您知道吗,大量鲜为人知的 AI 工具可以提供精彩的、独特的经历?这里有六个最好的。 1 Ditto Music Ditto 不是您可以用来创建独特歌曲的众多 AI 音乐生成器之一,而...
    人工智慧 發佈於2024-11-08
  • 這 7 個跡象表明我們已經達到人工智慧的巔峰
    這 7 個跡象表明我們已經達到人工智慧的巔峰
    无论您在网上查找什么,都有网站、服务和应用程序宣称他们使用人工智能使其成为最佳选择。我不了解你的情况,但它的持续存在已经让人厌倦了。 因此,虽然人工智能肯定会留在我们的日常生活中,但有几个迹象表明我们已经达到了人工智能炒作的顶峰。 1 公众兴趣有限 虽然人工智能在科技圈受到了广泛关注,但重要的是要...
    人工智慧 發佈於2024-11-08
  • 4 個適合教師、講師和老闆的 AI 檢查 ChatGPT 偵測器工具
    4 個適合教師、講師和老闆的 AI 檢查 ChatGPT 偵測器工具
    随着 ChatGPT 能力的进步,区分哪些内容是人类编写的,哪些内容是人工智能生成的变得越来越困难。这使得老师和老板很难识别哪些内容是人手写的,哪些内容是通过 ChatGPT 生成的。 如果您很难区分,这里有最好的 ChatGPT 检测工具 我们如何测试每个 ChatGPT 检查工具 有很多...
    人工智慧 發佈於2024-11-08
  • ChatGPT 的高級語音功能正在向更多用戶推出
    ChatGPT 的高級語音功能正在向更多用戶推出
    如果您曾經想與 ChatGPT 進行全面對話,現在您可以。也就是說,只要你付費就可以獲得使用ChatGPT的特權。更多付費用戶正在存取 ChatGPT 的高級語音模式 (AVM),該模式旨在使與 ChatGPT 的互動感覺更加自然。 高級語音來到 ChatGPT Plus 和 Teams Ope...
    人工智慧 發佈於2024-11-08

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3