使用 Ollama 通过 Node.js API 在本地运行和创建您自己的 LLM

首页 > 编程 > 使用 Ollama 通过 Node.js API 在本地运行和创建您自己的 LLM

使用 Ollama 通过 Node.js API 在本地运行和创建您自己的 LLM

发布于2024-08-14

Running and Creating Your Own LLMs Locally with Node.js API using Ollama

在本指南中，您将学习如何在本地计算机上运行大型语言模型 (LLM) 并创建您自己的 LLM。我们还将介绍如何使用 Node.js 中的 ollama-js 库为您的自定义模型创建 API。

第1步：安装Ollama

Ollama 是本地运行 LLM 的理想选择，因为它简单且与非 GPU 密集型机器兼容。首先从官网安装Ollama：

Ollama 官方网站

第 2 步：选择您喜欢的 LLM 模式

安装Ollama后，您可以从多种可用的LLM模型中进行选择。您可以在其 GitHub 存储库上找到可用模型的列表：

Ollama GitHub 存储库

第 3 步：在本地运行模型

要在本地运行模型，请在终端中使用以下命令。请注意，第一次运行可能需要更长的时间，因为 Ollama 在本地下载并存储模型。由于模型是在本地访问的，后续运行会更快。

ollama run {model_name}

第四步：创建自己的法学硕士

要创建自定义 LLM，您需要创建一个模型文件。以下是如何定义模型的示例：

FROM 

# Define your parameters here
PARAMETER temperature 0.5

SYSTEM """
You are an English teaching assistant named Mr. Kamal Kishor. You help with note-making, solving English grammar assignments, and reading comprehensions.
"""

将其保存为模型文件。要从此文件创建模型，请在终端中运行以下命令：

ollama create mrkamalkishor -f ./modelfile

创建模型后，您可以使用以下命令在本地与其交互：

ollama run mrkamalkishor

步骤 5：为自定义模型创建 Node.js API

在这一步中，我们将使用 ollama-js 库在 Node.js 中创建 API。

在 Node.js 项目中安装 Ollama 库：

npm install ollama

创建您的 API 端点：

import express from 'express';
import ollama from 'ollama';

const app = express();
const router = express.Router();

app.use(express.json());

router.post('/ask-query', async (req, res) => {
  const { query } = req.body;

  try {
    const response = await ollama.chat({
      model: 'mrkamalkishor',
      messages: [{ role: 'user', content: query }],
    });

    res.json({ reply: response.message.content });
  } catch (error) {
    res.status(500).send({ error: 'Error interacting with the model' });
  }
});

app.use('/api', router);

const PORT = process.env.PORT || 3000;
app.listen(PORT, () => {
  console.log(`Server is running on port ${PORT}`);
});

此代码设置了一个带有端点的 Express.js 服务器，以与您的自定义模型进行交互。当使用包含用户查询的 JSON 正文向 /ask-query 发出 POST 请求时，服务器会使用模型的输出进行响应。

概括

通过执行以下步骤，您可以安装 Ollama、在本地选择并运行 LLM、创建自定义 LLM，并设置 Node.js API 与之交互。此设置允许您在本地计算机上利用强大的语言模型，而无需 GPU 密集型硬件。

版本声明本文转载于：https://dev.to/koolkamalkishor/running-and-creating-your-own-llms-locally-with-nodejs-api-using-ollama-97f?1如有侵犯，请联系[email protected]删除

最新教程更多>

CSS 媒体查询
确保网站在各种设备上无缝运行比以往任何时候都更加重要。随着用户通过台式机、笔记本电脑、平板电脑和智能手机访问网站，响应式设计已成为必要。响应式设计的核心在于媒体查询，这是一项强大的 CSS 功能，允许开发人员根据用户设备的特征应用不同的样式。在本文中，我们将探讨什么是媒体查询、它们如何工作以及实现它...

编程发布于2024-11-05
了解 JavaScript 中的提升：综合指南
JavaScript 中的提升提升是一种行为，其中变量和函数声明在之前被移动（或“提升”）到其包含范围（全局范围或函数范围）的顶部代码被执行。这意味着您可以在代码中实际声明变量和函数之前使用它们。变量提升变量用 var 声明的变量被提升到其作...

编程发布于2024-11-05
将 Stripe 集成到单一产品 Django Python 商店中
In the first part of this series, we created a Django online shop with htmx. In this second part, we'll handle orders using Stripe. What We'll...

编程发布于2024-11-05
在 Laravel 中测试排队作业的技巧
使用 Laravel 应用程序时，经常会遇到命令需要执行昂贵任务的情况。为了避免阻塞主进程，您可能决定将任务卸载到可以由队列处理的作业。让我们看一个例子。想象一下命令 app:import-users 需要读取一个大的 CSV 文件并为每个条目创建一个用户。该命令可能如下所示： /* Import...

编程发布于2024-11-05
如何创建人类水平的自然语言理解 (NLU) 系统
Scope: Creating an NLU system that fully understands and processes human languages in a wide range of contexts, from conversations to literature. ...

编程发布于2024-11-05
如何使用 JSTL 迭代 HashMap 中的 ArrayList？
使用 JSTL 迭代 HashMap 中的 ArrayList在 Web 开发中，JSTL（JavaServer Pages 标准标记库）提供了一组标记来简化 JSP 中的常见任务（ Java 服务器页面）。其中一项任务是迭代数据结构。要迭代 HashMap 及其中包含的 ArrayList，可以使...

编程发布于2024-11-05
Encore.ts — 比 ElysiaJS 和 Hono 更快
几个月前，我们发布了 Encore.ts — TypeScript 的开源后端框架。由于已经有很多框架，我们想分享我们做出的一些不常见的设计决策以及它们如何带来卓越的性能数据。性能基准我们之前发布的基准测试显示 Encore.ts 比 Express 快 9 倍，比 Fasti...

编程发布于2024-11-05
为什么使用 + 对字符串文字进行字符串连接失败？
连接字符串文字与字符串在 C 中，运算符可用于连接字符串和字符串文字。但是，此功能存在限制，可能会导致混乱。在问题中，作者尝试连接字符串文字“Hello”、“,world”和“!”以两种不同的方式。第一个例子：const string hello = "Hello"; const...

编程发布于2024-11-05
React 重新渲染：最佳性能的最佳实践
React高效的渲染机制是其受欢迎的关键原因之一。然而，随着应用程序复杂性的增加，管理组件重新渲染对于优化性能变得至关重要。让我们探索优化 React 渲染行为并避免不必要的重新渲染的最佳实践。 1. 使用 React.memo() 作为函数式组件 React.memo() 是一个高...

编程发布于2024-11-05
如何实现条件列创建：探索 Pandas DataFrame 中的 If-Elif-Else？
Creating a Conditional Column: If-Elif-Else in Pandas给定的问题要求将新列添加到 DataFrame 中基于一系列条件标准。挑战在于在实现这些条件的同时保持代码效率和可读性。使用函数应用程序的解决方案一种方法涉及创建一个将每一行映射到所需结果的函数...

编程发布于2024-11-05
介绍邱！
我很高兴地宣布发布 Qiu – 一个严肃的 SQL 查询运行器，旨在让原始 SQL 再次变得有趣。老实说，ORM 有其用武之地，但当您只想编写简单的 SQL 时，它们可能会有点让人不知所措。我一直很喜欢编写原始 SQL 查询，但我意识到我需要练习——大量的练习。这就是Qiu发挥作用的地方。有了 Q...

编程发布于2024-11-05
为什么 CSS 中的 Margin-Top 百分比是根据容器宽度计算的？
CSS 中的 margin-top 百分比计算当对元素应用 margin-top 百分比时，必须了解计算方式执行。与普遍的看法相反，边距顶部百分比是根据包含块的宽度而不是其高度来确定的。W3C 规范解释：根据W3C 规范，“百分比是根据生成的框包含块的宽度计算的。”此规则适用于“margin-top...

编程发布于2024-11-05
如何解决 CSS 转换期间 Webkit 文本渲染不一致的问题？
解决 CSS 转换期间的 Webkit 文本渲染不一致在 CSS 转换期间，特别是缩放元素时，Webkit 中可能会出现文本渲染不一致的情况浏览器。这个问题源于浏览器尝试优化渲染性能。一种解决方案是通过添加以下属性来强制对过渡元素的父元素进行硬件加速：-webkit-transform: trans...

编程发布于2024-11-05
使用 Reactables 简化 RxJS
介绍 RxJS 是一个功能强大的库，但众所周知，它的学习曲线很陡峭。该库庞大的 API 界面，再加上向反应式编程的范式转变，可能会让新手不知所措。我创建了 Reactables API 来简化 RxJS 的使用并简化开发人员对反应式编程的介绍。例子我们将构建...

编程发布于2024-11-05
如何在 Pandas 中查找多列的最大值？
查找 Pandas 中多列的最大值要确定 pandas DataFrame 中多列的最大值，可以采用多种方法。以下是实现此目的的方法：对指定列使用 max() 函数此方法涉及显式选择所需的列并应用 max() 函数： df[["A", "B"]] df[[&q...

编程发布于2024-11-05