「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > AI > LLM を超えて: 小規模言語モデルが AI の未来である理由がここにあります

LLM を超えて: 小規模言語モデルが AI の未来である理由がここにあります

2024 年 11 月 1 日に公開
ブラウズ:838

Open AI の ChatGPT のリリースにより、大規模言語モデル (LLM) が登場しました。それ以来、いくつかの企業も LLM を立ち上げましたが、現在は小規模言語モデル (SLM) に傾いている企業が増えています。

SLM は勢いを増していますが、SLM とは何ですか?また、LLM との違いは何ですか?

小規模言語モデルとは何ですか?

小規模言語モデル (SLM) は、パラメーターが少ない人工知能モデルの一種です (これは、トレーニング中に学習されたモデルの値であると考えてください)。より大きな対応物と同様に、SLM はテキストを生成し、他のタスクを実行できます。ただし、SLM はトレーニングに使用するデータセットが少なく、パラメーターも少なく、トレーニングと実行に必要な計算能力も少なくなります。

SLM は主要な機能に焦点を当てており、フットプリントが小さいため、さまざまなデバイスに導入できます。モバイル デバイスのようなハイエンド ハードウェアを備えていない場合。たとえば、Google の Nano は、モバイル デバイス上で動作する、ゼロから構築されたオンデバイス SLM です。同社によれば、Nano はサイズが小さいため、ネットワーク接続の有無にかかわらずローカルで実行できます。

Beyond LLMs: Here\'s Why Small Language Models Are the Future of AI

Nano 以外にも、AI 分野では有力企業や今後の企業から多数の SLM が提供されています。人気のある SLM には、Microsoft の Phi-3、OpenAI の GPT-4o mini、Anthropic の Claude 3 Haiku、Meta の Llama 3、Mistral AI の Mixtral 8x7B などがあります。

他のオプションも利用できます。これらは LLM だと思われるかもしれませんが、実際にはそうではありません。 SLM。これは、ほとんどの企業がポートフォリオで複数の言語モデルをリリースし、LLM と SLM の両方を提供するマルチモデル アプローチを採用していることを考慮すると、特に当てはまります。一例として GPT-4 があり、GPT-4、GPT-4o (Omni)、GPT-4o mini などのさまざまなモデルがあります。

小規模言語モデルと大規模言語モデル

SLM について議論するとき、その大きな対応物である LLM を無視することはできません。 SLM と LLM の主な違いは、パラメーターの観点から測定されるモデル サイズです。

この記事の執筆時点では、モデルに使用すべきパラメーターの最大数について AI 業界で合意はありません。 SLM と見なされるには超過するか、LLM と見なされるために必要な最小数を超えます。ただし、SLM には通常、数百万から数十億のパラメータがありますが、LLM にはさらに多く、数兆にも達します。

たとえば、2020 年にリリースされた GPT-3 には 1,750 億のパラメータがあります (そしてGPT-4 モデルは約 1 兆 7,600 億個あると噂されています)、一方、Microsoft の 2024 年の Phi-3-mini、Phi-3-small、および Phi-3-medium SLM は、それぞれ 38 億個、7 億個、140 億個のパラメーターを測定します。

Beyond LLMs: Here\'s Why Small Language Models Are the Future of AI

SLM と LLM を区別するもう 1 つの要因は、トレーニングに使用されるデータの量です。 SLM は少量のデータでトレーニングされますが、LLM は大規模なデータセットを使用します。この違いは、複雑なタスクを解決するモデルの能力にも影響します。

トレーニングでは大規模なデータが使用されるため、LLM は高度な推論を必要とするさまざまなタイプの複雑なタスクを解決するのに適していますが、SLM はより単純なタスクに適しています。タスク。 LLM とは異なり、SLM は使用するトレーニング データが少なくなりますが、LLM にある機能の多くを小さなパッケージで実現するには、使用するデータの品質が高くなる必要があります。

小さな言語モデルが未来である理由

ほとんどのユースケースでは、SLM は企業や消費者がさまざまなタスクを実行するために使用する主流モデルになるのに適しています。確かに、LLM には利点があり、複雑なタスクの解決など、特定の使用例により適しています。ただし、次の理由により、ほとんどのユースケースでは SLM が将来の選択肢となります。

1. トレーニングとメンテナンスのコストが低い

Beyond LLMs: Here\'s Why Small Language Models Are the Future of AI

SLM は、LLM よりもトレーニングに必要なデータが少ないため、トレーニング データ、財務、またはその両方が限られている個人および中小企業にとって、最も実行可能なオプションです。 LLM は大量のトレーニング データを必要とし、ひいてはトレーニングと実行の両方に膨大な計算リソースを必要とします。

これを大局的に考えると、OpenAI の CEO、サム アルトマンは、トレーニングに 1 億ドル以上かかったと認めました。 MITのイベントで講演中のGPT-4(Wiredによる)。別の例は、Meta の OPT-175B LLM です。 CNBC によると、Meta は 992 個の NVIDIA A100 80GB GPU を使用してトレーニングされたと述べており、そのコストは 1 台あたり約 10,000 ドルです。エネルギーや給与などの他の経費を含まない場合、コストは約 900 万ドルになります。

このような数字では、中小企業が LLM をトレーニングするのは現実的ではありません。対照的に、SLM はリソースの面で参入障壁が低く、運営コストも低いため、より多くの企業がこれを採用するでしょう。

2. パフォーマンスの向上

Beyond LLMs: Here\'s Why Small Language Models Are the Future of AI

パフォーマンスももう 1 つの問題です。 SLM はそのコンパクトなサイズにより LLM に勝る領域です。 SLM は遅延が少なく、リアルタイム アプリケーションなど、より高速な応答が必要なシナリオに適しています。たとえば、デジタル アシスタントなどの音声応答システムでは、より迅速な応答が好まれます。

デバイス上で実行する (これについては後ほど説明します) ということは、リクエストがオンライン サーバーに行ったり戻ったりする必要がないことも意味します。

3. より正確

Beyond LLMs: Here\'s Why Small Language Models Are the Future of AI

生成 AI に関しては、変わらないことが 1 つあります。それは、ゴミが入ってゴミが出るということです。現在の LLM は、生のインターネット データの大規模なデータセットを使用してトレーニングされています。したがって、すべての状況で正確であるとは限りません。これは ChatGPT や同様のモデルの問題の 1 つであり、AI チャットボットの発言すべてを信頼すべきではない理由です。一方、SLM は LLM よりも高品質のデータを使用してトレーニングされるため、精度が高くなります。

SLM は、特定のタスクやドメインに焦点を当てたトレーニングでさらに微調整することもでき、それらのタスクやドメインの精度が向上します。

4. オンデバイスで実行可能

Beyond LLMs: Here\'s Why Small Language Models Are the Future of AI

SLM は LLM よりも必要な計算能力が低いため、エッジ コンピューティングのケースに最適です。これらは、大きな計算能力やリソースを持たないスマートフォンや自動運転車などのエッジ デバイスに導入できます。 Google の Nano モデルはデバイス上で実行できるため、アクティブなインターネット接続がない場合でも機能します。

この機能は、企業と消費者の両方に有利な状況をもたらします。まず、ユーザー データがクラウドに送信されるのではなくローカルで処理されるため、プライバシーが確保されます。これは、スマートフォンに AI が統合され、私たちに関するほぼすべての詳細が含まれるようになるにつれて重要になります。 AI タスクを処理するために大規模なサーバーを展開して実行する必要がないため、企業にとってもメリットがあります。

SLM は、Open AI、Google、Microsoft、 Anthropic、Metaなどからはそんなモデルがリリースされています。これらのモデルは、私たちのほとんどが LLM を使用する単純なタスクにより適しています。したがって、LLM は未来です。

しかし、LLM はどこにも行きません。代わりに、医学研究など、さまざまなドメインの情報を組み合わせて新しいものを生み出す高度なアプリケーションに使用されることになります。

リリースステートメント この記事は次の場所に転載されています: https://www.makeuseof.com/why-small- language-models-are-the-future-of-ai/ 権利侵害がある場合は、[email protected] に連絡して削除してください。
最新のチュートリアル もっと>
  • GPT-4o は GPT-4 を誰にでも提供します。これがその仕組みです
    GPT-4o は GPT-4 を誰にでも提供します。これがその仕組みです
    それで、GPT-4o とは何ですか? GPT-4oとは何ですか? GPT-4o は、ChatGPT 開発者の OpenAI の最新 AI モデルで、2024 年 5 月初旬の「Spring Update」イベントで公開されました。少なくとも現時点では、以前の最高性能モデルである GPT-4 T...
    AI 2024 年 11 月 2 日に公開
  • Microsoft が Blizzard を買収、AI アートと翻訳の探求 [ポッドキャスト]
    Microsoft が Blizzard を買収、AI アートと翻訳の探求 [ポッドキャスト]
    今週のポッドキャストはこれらの質問に答え、英国政府が Microsoft による Activision Blizzard の買収を承認した場合の影響について考察します。 Apple Podcasts、Spotify、Google Podcasts、Amazon Music と Audible、...
    AI 2024 年 11 月 1 日に公開
  • LLM を超えて: 小規模言語モデルが AI の未来である理由がここにあります
    LLM を超えて: 小規模言語モデルが AI の未来である理由がここにあります
    Open AI の ChatGPT のリリースにより、大規模言語モデル (LLM) が登場しました。それ以来、いくつかの企業も LLM を立ち上げましたが、現在は小規模言語モデル (SLM) に傾いている企業が増えています。SLM は勢いを増していますが、SLM とは何ですか?また、LLM との違い...
    AI 2024 年 11 月 1 日に公開
  • ベスト 5 のオープンソース AI 画像ジェネレーター
    ベスト 5 のオープンソース AI 画像ジェネレーター
    特定の種類の画像に特化した、無料でオープンソースの AI テキスト画像ジェネレーターがインターネット上で利用可能です。そこで、私たちは山を調べて、今すぐ試せる最高のオープンソース AI テキスト変換ジェネレーターを見つけました。 1 Craiyon Craiyon は、最も簡単にアクセスできる...
    AI 2024 年 9 月 2 日に公開
  • OpenAI がカスタム GPT ストアを開始: 今すぐアクセスして使用する方法
    OpenAI がカスタム GPT ストアを開始: 今すぐアクセスして使用する方法
    OpenAI はついに待望の GPT ストアを発表し、ライティングやデザインからプログラミングや生産性までの専門的なチャットボットを備えた ChatGPT コミュニティが作成したカスタム GPT のセレクションをユーザーに提供します。この発表は、2022 年 11 月の発表以来世界を席巻した AI...
    AI 2024 年 9 月 2 日に公開
  • Claude 3 とは何ですか?そしてそれを使って何ができるのですか?
    Claude 3 とは何ですか?そしてそれを使って何ができるのですか?
    Anthropic は、GPT-4 を混乱させる可能性のある AI モデルのファミリーである Claude 3 のリリースを発表しました。傑出したポテンシャルを持っていますが、ChatGPT の王座を奪う準備はできていますか? クロード3とは? Claude 3 は、Anthropic が A...
    AI 2024 年 9 月 1 日に公開
  • ChatGPT に多数の新機能が追加されました。注目すべき機能は次のとおりです
    ChatGPT に多数の新機能が追加されました。注目すべき機能は次のとおりです
    OpenAI の 2024 年 5 月初旬の ChatGPT アップデートは大規模なもので、世界をリードする生成 AI チャットボットに大量の新機能をもたらしました。改善点のほとんどは、ユーザー インタラクションの強化、新機能、全体的なパフォーマンスの向上を中心としたもので、試してみるべき理由はた...
    AI 2024 年 9 月 1 日に公開
  • LLM を使用しましたか?次に登場するのは LAM ですが、作業が必要です
    LLM を使用しましたか?次に登場するのは LAM ですが、作業が必要です
    生成型 AI チャットボットの台頭により、舞台裏で動作する基盤となる AI テクノロジーである「大規模言語モデル」という用語が一般的になりました。大規模言語モデル (LLM) は、ユーザー入力に応じて予測された言語セットに基づいて出力を生成し、AI が自分で考えることができるかのように見せます。 ...
    AI 2024 年 8 月 31 日に公開
  • ChatGPT カスタム命令を使用する 5 つの最良の方法
    ChatGPT カスタム命令を使用する 5 つの最良の方法
    ChatGPT は従来、パーソナライゼーションとメモリの一貫性に問題がありました。これを修正するために、OpenAI は無料または有料にかかわらず、すべてのユーザーにカスタム指示を導入しました。 誰でも ChatGPT のカスタム指示機能を使用して、ChatGPT から得られる応答をパーソナライ...
    AI 2024 年 8 月 31 日に公開
  • ChatGPT の最新アップデートにより、完全にカスタムの GPT モデルを作成できるようになりました
    ChatGPT の最新アップデートにより、完全にカスタムの GPT モデルを作成できるようになりました
    OpenAI の主力 AI 製品である ChatGPT は、多数の新機能を備えた革新的なアップデートを受け取りました。いくつかの重要なアップデートが同時に展開されるため、OpenAI は ChatGPT ユーザー、特に ChatGPT Plus 加入者を本当に台無しにしました。 理解すべきことは...
    AI 2024 年 8 月 29 日に公開
  • テキストの要約に ChatGPT を信頼してはいけない理由
    テキストの要約に ChatGPT を信頼してはいけない理由
    ChatGPT が知っていることには限界があります。そして、そのプログラムは、たとえ結果が間違っていたとしても、ユーザーが要求したものを強制的に提供します。これは、ChatGPT が間違いを犯すことを意味します。さらに、ChatGPT が犯すよくある間違いがいくつかあります。特に情報を要約するとき...
    AI 2024 年 8 月 29 日に公開
  • Copilot と Copilot Pro: 違いは何ですか? アップグレードする必要がありますか?
    Copilot と Copilot Pro: 違いは何ですか? アップグレードする必要がありますか?
    Microsoft Copilot は、毎月フォークアウトせずに OpenAI の ChatGPT Plus を使用したい人にとって天国です。 そして、それがすぐには変わらないと聞いてとてもうれしいでしょう。しかし、Microsoft は、新しい機能、カスタム GPT サポート、さらに、Micr...
    AI 2024 年 8 月 28 日に公開
  • Android で ChatGPT ウィジェットを使用する方法
    Android で ChatGPT ウィジェットを使用する方法
    続行する前に、ChatGPT Android アプリを更新する必要があります。1.2024.052 より古いバージョンを使用している場合は、この便利なホーム画面ウィジェットを作成できません。現在、ChatGPT ウィジェットのバリエーションは 4x2 オプションの 1 つだけです。 ウィジェット...
    AI 2024 年 8 月 28 日に公開
  • GPT-4 なしで Auto-GPT を使用する価値はありますか?
    GPT-4 なしで Auto-GPT を使用する価値はありますか?
    AI テクノロジーは急速に加速しており、すべてを変える可能性のある汎用人工知能に向かって進んでいます。まだそこまで到達していませんが、ChatGPT-4 は最も先進的な AI モデルであると広く考えられています。 さて、GPT-4 の使用をさらに簡単にする新しい機能、Auto-GPT があります...
    AI 2024 年 8 月 27 日に公開
  • ChatGPT デスクトップ アプリが待ちきれませんか?代わりにこのオープンソースの代替案を試してください
    ChatGPT デスクトップ アプリが待ちきれませんか?代わりにこのオープンソースの代替案を試してください
    2024 年春の大規模アップデートの一環として、OpenAI は、待望の ChatGPT デスクトップ バージョンが登場することを明らかにしました。 macOS から、OpenAI は正式に ChatGPT をデスクトップに導入し、Windows のサポートは後で提供されます。 しかし、私のよ...
    AI 2024 年 8 月 27 日に公開

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3