Ollama를 사용하여 Node.js API를 사용하여 로컬에서 자체 LLM 실행 및 생성

첫 장 > 프로그램 작성 > Ollama를 사용하여 Node.js API를 사용하여 로컬에서 자체 LLM 실행 및 생성

Ollama를 사용하여 Node.js API를 사용하여 로컬에서 자체 LLM 실행 및 생성

2024-08-14에 게시됨

검색:225

Running and Creating Your Own LLMs Locally with Node.js API using Ollama

이 가이드에서는 로컬 컴퓨터에서 LLM(대형 언어 모델)을 실행하고 고유한 LLM을 만드는 방법을 알아봅니다. 또한 Node.js의 ollama-js 라이브러리를 사용하여 사용자 정의 모델용 API를 생성하는 방법도 다룰 것입니다.

1단계: Ollama 설치

Ollama는 단순성과 GPU 집약적이지 않은 머신과의 호환성으로 인해 로컬에서 LLM을 실행하는 데 이상적인 선택입니다. 공식 웹사이트에서 Ollama를 설치하여 시작하세요:

올라마 공식 사이트

2단계: 선호하는 LLM 모델 선택

Ollama를 설치한 후 사용 가능한 다양한 LLM 모델 중에서 선택할 수 있습니다. GitHub 저장소에서 사용 가능한 모델 목록을 찾을 수 있습니다:

Ollama GitHub 저장소

3단계: 로컬에서 모델 실행

모델을 로컬에서 실행하려면 터미널에서 다음 명령을 사용하세요. Ollama가 모델을 로컬로 다운로드하고 저장하므로 첫 번째 실행은 더 오래 걸릴 수 있습니다. 모델이 로컬에서 액세스되므로 후속 실행이 더 빨라집니다.

ollama run {model_name}

4단계: 나만의 LLM 만들기

맞춤형 LLM을 만들려면 모델 파일을 만들어야 합니다. 다음은 모델을 정의하는 방법의 예입니다.

FROM 

# Define your parameters here
PARAMETER temperature 0.5

SYSTEM """
You are an English teaching assistant named Mr. Kamal Kishor. You help with note-making, solving English grammar assignments, and reading comprehensions.
"""

모델 파일로 저장하세요. 이 파일에서 모델을 생성하려면 터미널에서 다음 명령을 실행하세요.

ollama create mrkamalkishor -f ./modelfile

모델을 생성한 후 다음을 사용하여 로컬에서 상호 작용할 수 있습니다.

ollama run mrkamalkishor

5단계: 사용자 정의 모델을 위한 Node.js API 생성

이 단계에서는 ollama-js 라이브러리를 사용하여 Node.js에서 API를 생성합니다.

Node.js 프로젝트에 Ollama 라이브러리를 설치합니다.

npm install ollama

API 엔드포인트를 생성합니다.

import express from 'express';
import ollama from 'ollama';

const app = express();
const router = express.Router();

app.use(express.json());

router.post('/ask-query', async (req, res) => {
  const { query } = req.body;

  try {
    const response = await ollama.chat({
      model: 'mrkamalkishor',
      messages: [{ role: 'user', content: query }],
    });

    res.json({ reply: response.message.content });
  } catch (error) {
    res.status(500).send({ error: 'Error interacting with the model' });
  }
});

app.use('/api', router);

const PORT = process.env.PORT || 3000;
app.listen(PORT, () => {
  console.log(`Server is running on port ${PORT}`);
});

이 코드는 사용자 정의 모델과 상호 작용할 엔드포인트가 있는 Express.js 서버를 설정합니다. 사용자 쿼리가 포함된 JSON 본문을 사용하여 /ask-query에 대한 POST 요청이 이루어지면 서버는 모델의 출력으로 응답합니다.

요약

이 단계에 따라 Ollama를 설치하고, 로컬에서 LLM을 선택 및 실행하고, 사용자 정의 LLM을 생성하고, 상호 작용할 Node.js API를 설정할 수 있습니다. 이 설정을 사용하면 GPU 집약적인 하드웨어 없이도 로컬 컴퓨터에서 강력한 언어 모델을 활용할 수 있습니다.

릴리스 선언문 이 기사는 https://dev.to/koolkamalkishor/running-and-creating-your-own-llms-locally-with-nodejs-api-using-ollama-97f?1에서 복제됩니다. 침해가 있는 경우, 문의 Study_golang@163 .comdelete

최신 튜토리얼 더>

CSS 미디어 쿼리
웹사이트가 다양한 기기에서 원활하게 작동하도록 보장하는 것이 그 어느 때보다 중요합니다. 사용자가 데스크톱, 노트북, 태블릿, 스마트폰에서 웹사이트에 액세스함에 따라 반응형 디자인이 필수가 되었습니다. 반응형 디자인의 중심에는 개발자가 사용자 기기의 특성에 따라 다양한...

프로그램 작성 2024-11-05에 게시됨
JavaScript의 호이스팅 이해: 종합 가이드
자바스크립트에서 호이스팅 호이스팅은 변수 및 함수 선언을 포함 범위(전역 범위 또는 함수 범위)의 맨 위로 이동(또는 "호이스팅")하는 동작입니다. 코드가 실행됩니다. 즉, 코드에서 실제로 선언되기 전에 변수와 함수를 사용할 수 있습니...

프로그램 작성 2024-11-05에 게시됨
Stripe를 단일 제품 Django Python Shop에 통합
In the first part of this series, we created a Django online shop with htmx. In this second part, we'll handle orders using Stripe. What We'll...

프로그램 작성 2024-11-05에 게시됨
Laravel에서 대기 중인 작업을 테스트하기 위한 팁
Laravel 애플리케이션으로 작업할 때 명령이 비용이 많이 드는 작업을 수행해야 하는 시나리오를 접하는 것이 일반적입니다. 기본 프로세스를 차단하지 않으려면 대기열에서 처리할 수 있는 작업으로 작업을 오프로드하기로 결정할 수 있습니다. 예제를 살펴보겠습니다. app:...

프로그램 작성 2024-11-05에 게시됨
인간 수준의 자연어 이해(NLU) 시스템을 만드는 방법
Scope: Creating an NLU system that fully understands and processes human languages in a wide range of contexts, from conversations to literature. ...

프로그램 작성 2024-11-05에 게시됨
JSTL을 사용하여 HashMap 내에서 ArrayList를 반복하는 방법은 무엇입니까?
JSTL을 사용하여 HashMap 내에서 ArrayList 반복웹 개발에서 JSTL(JavaServer Pages Standard Tag Library)은 JSP( 자바 서버 페이지). 그러한 작업 중 하나는 데이터 구조를 반복하는 것입니다.HashMap과 그 안에 포...

프로그램 작성 2024-11-05에 게시됨
Encore.ts — ElysiaJS 및 Hono보다 빠릅니다.
몇 달 전 우리는 TypeScript용 오픈 소스 백엔드 프레임워크인 Encore.ts를 출시했습니다. 이미 많은 프레임워크가 있으므로 우리는 우리가 내린 흔하지 않은 디자인 결정과 그것이 어떻게 놀라운 성능 수치로 이어지는지 공유하고 싶었습니다. 성능 ...

프로그램 작성 2024-11-05에 게시됨
문자열 리터럴에서 +를 사용한 문자열 연결이 실패하는 이유는 무엇입니까?
문자열 리터럴을 문자열과 연결C에서는 연산자를 사용하여 문자열과 문자열 리터럴을 연결할 수 있습니다. 그러나 이 기능에는 혼란을 초래할 수 있는 제한 사항이 있습니다.질문에서 작성자는 문자열 리터럴 "Hello", ",world" 및...

프로그램 작성 2024-11-05에 게시됨
React Re-Rendering: 최적의 성능을 위한 모범 사례
React의 효율적인 렌더링 메커니즘은 React가 인기를 얻는 주요 이유 중 하나입니다. 그러나 애플리케이션이 복잡해짐에 따라 구성 요소 다시 렌더링을 관리하는 것이 성능을 최적화하는 데 중요해졌습니다. React의 렌더링 동작을 최적화하고 불필요한 재렌더링을 방지하...

프로그램 작성 2024-11-05에 게시됨
조건부 열 생성을 달성하는 방법: Pandas DataFrame에서 If-Elif-Else 탐색?
조건부 열 생성: Pandas의 If-Elif-Else주어진 문제에서는 DataFrame에 새 열을 추가해야 합니다. 일련의 조건부 기준을 기반으로 합니다. 문제는 코드 효율성과 가독성을 유지하면서 이러한 조건을 구현하는 것입니다.함수 적용을 사용한 솔루션한 가지 접근...

프로그램 작성 2024-11-05에 게시됨
큐를 소개합니다!
원시 SQL을 다시 재미있게 만들기 위해 설계된 실용적인 SQL 쿼리 실행기인 Qiu의 출시를 발표하게 되어 기쁩니다. 솔직하게 말하면 ORM이 그 자리를 차지하지만 간단한 SQL을 작성하는 것만으로도 약간 부담스러울 수 있습니다. 저는 항상 원시 SQL 쿼리를 작성하...

프로그램 작성 2024-11-05에 게시됨
CSS의 컨테이너 너비를 기준으로 여백 상단 백분율이 계산되는 이유는 무엇입니까?
CSS의 여백 상단 백분율 계산요소에 여백 상단 백분율을 적용할 때 계산 방법을 이해하는 것이 중요합니다. 수행. 일반적인 믿음과는 달리, 마진 상단 백분율은 높이가 아닌 포함 블록의 너비를 기준으로 결정됩니다.W3C 사양 설명:에 따르면 W3C 사양, "백분...

프로그램 작성 2024-11-05에 게시됨
CSS 전환 중 Webkit 텍스트 렌더링 불일치를 해결하는 방법은 무엇입니까?
CSS 전환 중 Webkit 텍스트 렌더링 불일치 해결CSS 전환 중, 특히 요소 크기를 조정할 때 Webkit 내에서 텍스트 렌더링의 불일치가 발생할 수 있습니다. 브라우저. 이 문제는 렌더링 성능을 최적화하려는 브라우저의 시도에서 발생합니다.한 가지 해결 방법은 다...

프로그램 작성 2024-11-05에 게시됨
Reactables로 단순화된 RxJS
소개 RxJS는 강력한 라이브러리이지만 학습 곡선이 가파른 것으로 알려져 있습니다. 리액티브 프로그래밍으로의 패러다임 전환과 결합된 라이브러리의 대규모 API 표면은 신규 사용자에게 부담스러울 수 있습니다. RxJS 사용을 단순화하고 개발자의 반응형 프...

프로그램 작성 2024-11-05에 게시됨
Pandas의 여러 열에서 최대값을 찾는 방법은 무엇입니까?
Pandas의 여러 열에서 최대값 찾기Pandas DataFrame의 여러 열에서 최대값을 확인하려면 다양한 접근 방식을 사용할 수 있습니다. . 이를 달성하는 방법은 다음과 같습니다.지정된 열에 max() 함수 사용이 방법에는 원하는 열을 명시적으로 선택하고 max(...

프로그램 작성 2024-11-05에 게시됨