Ollama を使用した Node.js API を使用してローカルで独自の LLM を実行および作成する

表紙 > プログラミング > Ollama を使用した Node.js API を使用してローカルで独自の LLM を実行および作成する

Ollama を使用した Node.js API を使用してローカルで独自の LLM を実行および作成する

2024 年 8 月 14 日に公開

ブラウズ：994

Running and Creating Your Own LLMs Locally with Node.js API using Ollama

このガイドでは、ローカルマシンで大規模言語モデル (LLM) を実行し、独自の LLM を作成する方法を学習します。 Node.js の ollama-js ライブラリを使用してカスタムモデルの API を作成する方法についても説明します。

ステップ 1: Ollama のインストール

Ollama は、そのシンプルさと GPU を多用しないマシンとの互換性により、LLM をローカルで実行するのに理想的な選択肢です。まずは公式 Web サイトから Ollama をインストールします:

オラマ公式サイト

ステップ 2: 希望する LLM モデルの選択

Ollama をインストールすると、利用可能なさまざまな LLM モデルから選択できます。利用可能なモデルのリストは、GitHub リポジトリで見つけることができます:

Ollama GitHub リポジトリ

ステップ 3: モデルをローカルで実行する

モデルをローカルで実行するには、ターミナルで次のコマンドを使用します。 Ollama がモデルをローカルにダウンロードして保存するため、最初の実行には時間がかかる場合があることに注意してください。モデルはローカルにアクセスされるため、後続の実行は高速になります。

ollama run {model_name}

ステップ 4: 独自の LLM を作成する

カスタム LLM を作成するには、モデルファイルを作成する必要があります。以下はモデルを定義する方法の例です:

FROM 

# Define your parameters here
PARAMETER temperature 0.5

SYSTEM """
You are an English teaching assistant named Mr. Kamal Kishor. You help with note-making, solving English grammar assignments, and reading comprehensions.
"""

これをモデルファイルとして保存します。このファイルからモデルを作成するには、ターミナルで次のコマンドを実行します:

ollama create mrkamalkishor -f ./modelfile

モデルを作成した後、次を使用してローカルでモデルを操作できます:

ollama run mrkamalkishor

ステップ 5: カスタムモデル用の Node.js API を作成する

このステップでは、ollama-js ライブラリを使用して Node.js で API を作成します。

Ollama ライブラリを Node.js プロジェクトにインストールします。

npm install ollama

API エンドポイントを作成します:

import express from 'express';
import ollama from 'ollama';

const app = express();
const router = express.Router();

app.use(express.json());

router.post('/ask-query', async (req, res) => {
  const { query } = req.body;

  try {
    const response = await ollama.chat({
      model: 'mrkamalkishor',
      messages: [{ role: 'user', content: query }],
    });

    res.json({ reply: response.message.content });
  } catch (error) {
    res.status(500).send({ error: 'Error interacting with the model' });
  }
});

app.use('/api', router);

const PORT = process.env.PORT || 3000;
app.listen(PORT, () => {
  console.log(`Server is running on port ${PORT}`);
});

このコードは、カスタムモデルと対話するためのエンドポイントを備えた Express.js サーバーをセットアップします。ユーザーのクエリを含む JSON 本文を使用して /ask-query に対して POST リクエストが行われると、サーバーはモデルの出力で応答します。

まとめ

これらの手順に従うことで、Ollama をインストールし、LLM をローカルで選択して実行し、カスタム LLM を作成し、それと対話するための Node.js API をセットアップできます。このセットアップにより、GPU を大量に使用するハードウェアを必要とせずに、ローカルマシン上で強力な言語モデルを活用できるようになります。

リリースステートメントこの記事は次の場所に転載されています: https://dev.to/koolkamalkishor/running-and-creating-your-own-llms-locally-with-nodejs-api-using-ollama-97f?1 侵害がある場合は、 Study_golang@163 .comdelete に連絡してください

最新のチュートリアルもっと>

Laravel でキューに入れられたジョブをテストするためのヒント
Laravel アプリケーションを使用する場合、コマンドが負荷の高いタスクを実行する必要があるシナリオに遭遇するのが一般的です。メインプロセスのブロックを避けるために、キューで処理できるジョブにタスクをオフロードすることを決定することもできます。例を見てみましょう。コマンド app:import-...

プログラミング 2024 年 11 月 5 日に公開
人間レベルの自然言語理解 (NLU) システムを作成する方法
Scope: Creating an NLU system that fully understands and processes human languages in a wide range of contexts, from conversations to literature. ...

プログラミング 2024 年 11 月 5 日に公開
JSTL を使用して HashMap 内で ArrayList を反復するにはどうすればよいですか?
JSTL を使用した HashMap 内の ArrayList の反復Web 開発では、JSTL (JavaServer Pages Standard Tag Library) は、JSP での一般的なタスクを簡素化するためのタグのセットを提供します ( Javaサーバーページ)。そのようなタスクの...

プログラミング 2024 年 11 月 5 日に公開
Encore.ts — ElysiaJS や Hono よりも高速
数か月前、私たちは TypeScript 用のオープンソースバックエンドフレームワークである Encore.ts をリリースしました。すでに多くのフレームワークが存在するため、私たちが行った珍しい設計上の決定のいくつかと、それがどのようにして驚くべきパフォーマンス数値につながるのかを共有したい...

プログラミング 2024 年 11 月 5 日に公開
+ を使用した文字列連結が文字列リテラルで失敗するのはなぜですか?
文字列リテラルと文字列の連結C では、演算子を使用して文字列と文字列リテラルを連結できます。ただし、この機能には混乱を招く可能性のある制限があります。質問の中で、作成者は文字列リテラル「Hello」、「,world」、および「!」を連結しようとしています。 2つの異なる方法で。最初の例:const ...

プログラミング 2024 年 11 月 5 日に公開
React の再レンダリング: 最適なパフォーマンスのためのベストプラクティス
React の効率的なレンダリングメカニズムは、その人気の主な理由の 1 つです。ただし、アプリケーションが複雑になるにつれて、コンポーネントの再レンダリングの管理がパフォーマンスを最適化するために重要になります。 React のレンダリング動作を最適化し、不必要な再レンダリングを回避するためのベ...

プログラミング 2024 年 11 月 5 日に公開
条件付き列の作成を実現する方法: Pandas DataFrame で If-Elif-Else を探索する?
条件付き列の作成: Pandas の If-Elif-Else指定された問題では、新しい列を DataFrame に追加することが求められます一連の条件付き基準に基づいて決定されます。課題は、コードの効率性と可読性を維持しながらこれらの条件を実装することにあります。関数アプリケーションを使用したソリ...

プログラミング 2024 年 11 月 5 日に公開
秋さんのご紹介です！
Qiu のリリースを発表できることを嬉しく思います。これは、生の SQL を再び楽しくするために設計された、実用的な SQL クエリランナーです。正直に言うと、ORM にはその役割がありますが、単純な SQL を書きたいだけの場合は、少し圧倒されてしまう可能性があります。私は生の SQL クエリ...

プログラミング 2024 年 11 月 5 日に公開
CSS でコンテナの幅に基づいてマージントップのパーセンテージが計算されるのはなぜですか?
CSS でのマージントップパーセンテージの計算要素にマージントップパーセンテージを適用する場合、その計算方法を理解することが重要です。実行されました。一般的な考えに反して、マージントップのパーセンテージは、ブロックを含むブロックの高さではなく、幅に基づいて決定されます。W3C 仕様の説明: W3...

プログラミング 2024 年 11 月 5 日に公開
CSS 移行中の Webkit テキストのレンダリングの不一致を解決するにはどうすればよいですか?
CSS 遷移中の Webkit テキストレンダリングの不一致を解決するCSS 遷移中、特に要素をスケーリングするときに、Webkit 内でテキストレンダリングの不一致が発生する可能性があります。ブラウザ。この問題は、ブラウザがレンダリングパフォーマンスを最適化しようとすることが原因で発生します...

プログラミング 2024 年 11 月 5 日に公開
Reactables で簡素化された RxJS
導入 RxJS は強力なライブラリですが、学習曲線が急であることが知られています。ライブラリの大規模な API サーフェスは、リアクティブプログラミングへのパラダイムシフトと相まって、初心者にとっては圧倒される可能性があります。 RxJS の使用法を簡素化し、開発者がリアクテ...

プログラミング 2024 年 11 月 5 日に公開
Pandas の複数の列にわたる最大値を見つける方法?
Pandas の複数の列にわたる最大値の検索Pandas DataFrame の複数の列にわたる最大値を決定するには、さまざまなアプローチを使用できます。。これを実現する方法は次のとおりです。指定された列で max() 関数を使用するこの方法では、目的の列を明示的に選択し、max() 関数を適用し...

プログラミング 2024 年 11 月 5 日に公開
CI/CD 入門: 最初のパイプラインを自動化するための初心者ガイド (Jenkins を使用)
目次導入 CI/CD とは何ですか? 継続的インテグレーション (CI) 継続的デリバリー (CD) 継続的展開 CI/CDの利点市場投入までの時間の短縮コード品質の向上効率的なコラボレーション自動化と一貫性の向上最初の CI/CD パイプラインを作成する方法ステップ...

プログラミング 2024 年 11 月 5 日に公開
TypeScript が大規模プロジェクトにおける JavaScript の信頼性を高める方法。
導入 JavaScript は Web 開発で広く使用されており、現在ではさまざまな業界の大規模プロジェクトに適用されています。ただし、これらのプロジェクトが成長するにつれて、JavaScript コードの管理が難しくなります。データ型の不一致、実行時の予期しないエラー、不明確なコ...

プログラミング 2024 年 11 月 5 日に公開
PHPのpassword_verify関数を使用してユーザーのパスワードを安全に検証するにはどうすればよいですか?
PHP を使用した暗号化されたパスワードの復号化多くのアプリケーションは、password_hash などの暗号化アルゴリズムを使用してユーザーパスワードを安全に保存します。ただし、ログイン試行を検証するときは、入力されたパスワードを暗号化されて保存されたバージョンと比較することが重要です。暗号化...

プログラミング 2024 年 11 月 5 日に公開