Exécuter et créer vos propres LLM localement avec l'API Node.js à l'aide d'Ollama

Page de garde > La programmation > Exécuter et créer vos propres LLM localement avec l'API Node.js à l'aide d'Ollama

Exécuter et créer vos propres LLM localement avec l'API Node.js à l'aide d'Ollama

Publié le 2024-08-14

Parcourir:992

Running and Creating Your Own LLMs Locally with Node.js API using Ollama

Dans ce guide, vous apprendrez à exécuter des modèles linguistiques étendus (LLM) sur votre ordinateur local et à créer votre propre LLM. Nous verrons également comment créer une API pour votre modèle personnalisé à l'aide de la bibliothèque ollama-js dans Node.js.

Étape 1 : Installation d'Ollama

Ollama est un choix idéal pour exécuter des LLM localement en raison de sa simplicité et de sa compatibilité avec les machines non gourmandes en GPU. Commencez par installer Ollama depuis le site officiel :

Site officiel d'Ollama

Étape 2 : Sélection de votre modèle LLM préféré

Après avoir installé Ollama, vous pouvez choisir parmi une variété de modèles LLM disponibles. Vous pouvez retrouver la liste des modèles disponibles sur leur dépôt GitHub :

Référentiel Ollama GitHub

Étape 3 : Exécuter le modèle localement

Pour exécuter le modèle localement, utilisez la commande suivante dans votre terminal. Notez que la première exécution peut prendre plus de temps car Ollama télécharge et stocke le modèle localement. Les exécutions suivantes seront plus rapides puisque le modèle est accessible localement.

ollama run {model_name}

Étape 4 : Créer votre propre LLM

Pour créer votre LLM personnalisé, vous devez créer un fichier modèle. Vous trouverez ci-dessous un exemple de définition de votre modèle :

FROM 

# Define your parameters here
PARAMETER temperature 0.5

SYSTEM """
You are an English teaching assistant named Mr. Kamal Kishor. You help with note-making, solving English grammar assignments, and reading comprehensions.
"""

Enregistrez-le en tant que fichier modèle. Pour créer le modèle à partir de ce fichier, exécutez la commande suivante dans votre terminal :

ollama create mrkamalkishor -f ./modelfile

Après avoir créé le modèle, vous pouvez interagir avec lui localement en utilisant :

ollama run mrkamalkishor

Étape 5 : Création d'une API Node.js pour le modèle personnalisé

Pour cette étape, nous utiliserons la bibliothèque ollama-js pour créer une API dans Node.js.

Installez la bibliothèque Ollama dans votre projet Node.js :

npm install ollama

Créez votre point de terminaison d'API :

import express from 'express';
import ollama from 'ollama';

const app = express();
const router = express.Router();

app.use(express.json());

router.post('/ask-query', async (req, res) => {
  const { query } = req.body;

  try {
    const response = await ollama.chat({
      model: 'mrkamalkishor',
      messages: [{ role: 'user', content: query }],
    });

    res.json({ reply: response.message.content });
  } catch (error) {
    res.status(500).send({ error: 'Error interacting with the model' });
  }
});

app.use('/api', router);

const PORT = process.env.PORT || 3000;
app.listen(PORT, () => {
  console.log(`Server is running on port ${PORT}`);
});

Ce code configure un serveur Express.js avec un point de terminaison pour interagir avec votre modèle personnalisé. Lorsqu'une requête POST est adressée à /ask-query avec un corps JSON contenant la requête de l'utilisateur, le serveur répond avec la sortie du modèle.

Résumé

En suivant ces étapes, vous pouvez installer Ollama, choisir et exécuter des LLM localement, créer votre LLM personnalisé et configurer une API Node.js pour interagir avec lui. Cette configuration vous permet d'exploiter des modèles de langage puissants sur votre ordinateur local sans nécessiter de matériel gourmand en GPU.

Déclaration de sortie Cet article est reproduit sur : https://dev.to/koolkamalkishor/running-and-creating-your-own-llms-locally-with-nodejs-api-using-ollama-97f?1 En cas de violation, veuillez contacter study_golang@163 .comdelete

Dernier tutoriel Plus>

Conseils pour tester les tâches en file d'attente dans Laravel
Lorsque vous travaillez avec des applications Laravel, il est courant de rencontrer des scénarios dans lesquels une commande doit effectuer une tâche ...

La programmation Publié le 2024-11-05
Comment créer un système de compréhension du langage naturel (NLU) au niveau humain
Scope: Creating an NLU system that fully understands and processes human languages in a wide range of contexts, from conversations to literature. ...

La programmation Publié le 2024-11-05
Comment itérer une ArrayList dans un HashMap à l'aide de JSTL ?
Itération d'une ArrayList dans une HashMap à l'aide de JSTLDans le développement Web, JSTL (JavaServer Pages Standard Tag Library) fournit un ...

La programmation Publié le 2024-11-05
Encore.ts - plus rapide qu'ElysiaJS et Hono
Il y a quelques mois, nous avons publié Encore.ts, un framework backend Open Source pour TypeScript. Comme il existe déjà de nombreux frameworks, nous...

La programmation Publié le 2024-11-05
Pourquoi la concaténation de chaînes utilisant + a-t-elle échoué avec les littéraux de chaîne ?
Concaténation de littéraux de chaîne avec des chaînesEn C , l'opérateur peut être utilisé pour concaténer des chaînes et des littéraux de chaîne. ...

La programmation Publié le 2024-11-05
React Re-Rendering : meilleures pratiques pour des performances optimales
Le mécanisme de rendu efficace de React est l'une des principales raisons de sa popularité. Cependant, à mesure qu'une application devient de ...

La programmation Publié le 2024-11-05
Comment réaliser la création de colonnes conditionnelles : explorer If-Elif-Else dans Pandas DataFrame ?
Création d'une colonne conditionnelle : If-Elif-Else dans PandasLe problème donné demande qu'une nouvelle colonne soit ajoutée à un DataFrame ...

La programmation Publié le 2024-11-05
Présentation de Qiu !
Je suis ravi d'annoncer la sortie de Qiu – un exécuteur de requêtes SQL simple conçu pour rendre le SQL brut à nouveau amusant. Soyons honnêtes, l...

La programmation Publié le 2024-11-05
Pourquoi le pourcentage de marge supérieure est-il calculé en fonction de la largeur du conteneur en CSS ?
Calcul du pourcentage de marge supérieure en CSSLors de l'application d'un pourcentage de marge supérieure à un élément, il est essentiel de c...

La programmation Publié le 2024-11-05
Comment résoudre les incohérences de rendu du texte du Webkit lors des transitions CSS ?
Résolution des incohérences de rendu du texte Webkit lors des transitions CSSPendant les transitions CSS, en particulier lors de la mise à l'échel...

La programmation Publié le 2024-11-05
RxJS simplifié avec Reactables
Introduction RxJS est une bibliothèque puissante, mais elle est connue pour avoir une courbe d'apprentissage abrupte. La grande surface d...

La programmation Publié le 2024-11-05
Comment trouver des valeurs maximales sur plusieurs colonnes dans Pandas ?
Recherche de valeurs maximales sur plusieurs colonnes dans PandasPour déterminer les valeurs maximales sur plusieurs colonnes dans un DataFrame pandas...

La programmation Publié le 2024-11-05
Premiers pas avec CI/CD : guide du débutant pour automatiser votre premier pipeline (avec Jenkins)
Table des matières Introduction Qu'est-ce que CI/CD ? Intégration Continue (CI) Livraison continue (CD) Déploiement continu Avantages du ...

La programmation Publié le 2024-11-05
Comment TypeScript rend JavaScript plus fiable dans les projets à grande échelle.
Introduction JavaScript est largement utilisé dans le développement Web et est désormais appliqué dans des projets plus vastes dans différent...

La programmation Publié le 2024-11-05
Comment vérifier les mots de passe des utilisateurs en toute sécurité avec la fonction password_verify de PHP ?
Déchiffrement des mots de passe cryptés avec PHPDe nombreuses applications stockent les mots de passe des utilisateurs en toute sécurité à l'aide ...

La programmation Publié le 2024-11-05

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article