개발에 오픈소스 AI 모델 사용

2024-11-09에 게시됨

검색:201

El uso de los modelos de IA open source en el desarrollo

지난해에는 이미지 생성이든 챗봇이든, 거대하고 전문적인 실행 도구로 확장하는 등 사용자의 삶을 편리하게 해주는 인공지능이 탑재된 수많은 도구가 등장했습니다. 프로세스.

저는 chatgpt, gemini, dall-e 또는 midjourney에서 이러한 많은 도구를 연구하고 배우고 테스트해 왔습니다. 모두 매우 잘 작동하지만 이러한 도구를 사용하여 애플리케이션을 확장하려고 할 때 해당 도구에 유용한 도구가 없다는 것을 알게 되었습니다. 무료 또는 공개 대체 소스.

이를 통해 연구를 한 단계 더 발전시킬 수 있었고 안정적인 확산 UI(이미지 생성, https://github.com/AUTOMATIC1111/stable-diffusion-webui)와 *를 접하게 되었습니다. ollama *(Chatbot, https://ollama.com/), 둘 다 서비스를 API로 실행하여 사용할 수 있게 해주는 오픈 소스 도구입니다. 이를 통해 오픈 소스 대안을 통해 한 단계 더 나아갔지만 이것이 작동하려면 애플리케이션에서 사용할 수 있도록 이러한 도구를 계속 실행해야 합니다.

이 기능을 애플리케이션에 적용하는 방법을 이해하려면 이러한 도구의 작동 방식을 이해하는 것이 중요합니다. 기본적으로 도구가 수행하는 작업은 LLM 또는 대규모 언어 모델인 "safetensors" 확장자가 있는 파일을 사용하는 것입니다. 이러한 모델은 수행하도록 훈련되었습니다. 훈련하는 사람의 필요에 따라 다른 기능을 제공합니다. (예: 이미지 생성, 번역, 코드 개발, 챗봇 등)

LLM 모델과 "safetensors" 파일에 대해 조금 이해하면 다음과 같은 질문을 얻게 됩니다. 내 응용 프로그램에서 이러한 파일을 사용하는 방법, 이것이 오픈 소스 인공 지능의 웹 사이트/데이터베이스인 HugginFace가 등장하는 곳입니다. 모델을 만들고 우리가 원하는 "Transformers" 및 "Diffusers"에 대한 2개의 매우 유용한 구성 요소를 포함하는 Python용 자체 라이브러리를 만들었습니다.

*Transformers *(https://huggingface.co/docs/transformers/index)는 오디오를 텍스트로 또는 그 반대로 변환하는 등 특수한 텍스트 모델을 사용할 수 있게 해주는 구성 요소입니다. 무엇보다도 메타 불꽃으로서의 채팅박스.

수입 변압기

import torch

model_id = "meta-llama/Llama-3.1-8B"

pipeline = transformers.pipeline(
    "text-generation", model=model_id, model_kwargs={"torch_dtype": torch.bfloat16}, device_map="auto"
)

pipeline("Hey how are you doing today?")

디퓨저 (https://huggingface.co/docs/diffusers/index)는 안정적인 확산과 같은 이미지 생성에 특화된 모든 모델을 사용할 수 있게 해주는 구성 요소입니다.

from diffusers import AutoPipelineForText2Image
import torch

pipe = AutoPipelineForText2Image.from_pretrained("stabilityai/sdxl-turbo", torch_dtype=torch.float16, variant="fp16")
pipe.to("cuda")

prompt = "A cinematic shot of a baby racoon wearing an intricate italian priest robe."

image = pipe(prompt=prompt, num_inference_steps=1, guidance_scale=0.0).images[0]

이 프로세스는 LLM 모델 추론으로 알려져 있으며 여기에서 이 정보를 기반으로 Python을 사용하여 다양한 애플리케이션에 인공 지능을 적용할 수 있습니다.

또한 nodejs와 같은 다른 언어로 모델 추론을 사용하려고 시도했지만 실제로는 Python만큼 잘 작동하지 않는다는 점에 유의해야 하지만 LLM에는 강력한 하드웨어가 필요하다는 점을 언급하는 것이 중요합니다. ChatGPT 또는 Gemini API를 사용하여 적절한 하드웨어 구매에 지출할 수 있는 비용을 절약할 수 있도록 추론을 모델화합니다.

이것이 제 첫 번째 기사입니다. 소프트웨어 개발에서 LLM 모델을 사용하는 방법이 이 경로의 단계를 건너뛰는 데 도움이 되기를 바랍니다.

릴리스 선언문 이 기사는 https://dev.to/miguelbc7/el-uso-de-los-modelos-de-ia-open-source-en-el-desarrollo-3j9h?1에서 복제됩니다. 침해가 있는 경우, 문의: Study_golang@163 .comdelete

최신 튜토리얼 더>

JQuery AJAX에서 FormData와 문자열 데이터를 동시에 보내는 방법은 무엇입니까?
JQuery AJAX에서 동시에 FormData 및 문자열 데이터 보내기파일 업로드와 관련된 양식으로 작업할 때 파일 데이터를 추가 항목과 결합해야 합니다. 서버에 제출할 문자열 데이터입니다. JQuery AJAX에서 FormData()를 사용하여 이를 달성하는 방법은...

프로그램 작성 2024년 11월 18일에 게시됨
MySQL을 사용하여 오늘 생일을 가진 사용자를 어떻게 찾을 수 있습니까?
MySQL을 사용하여 오늘 생일이 있는 사용자를 식별하는 방법MySQL을 사용하여 오늘이 사용자의 생일인지 확인하려면 생일이 일치하는 모든 행을 찾는 것이 필요합니다. 오늘 날짜. 이는 UNIX 타임스탬프로 저장된 생일을 오늘 날짜와 비교하는 간단한 MySQL 쿼리를 ...

프로그램 작성 2024년 11월 18일에 게시됨
`if` 문 너머: 명시적 `bool` 변환이 있는 유형을 형변환 없이 사용할 수 있는 다른 곳은 어디입니까?
형변환 없이 허용되는 bool로의 상황별 변환귀하의 클래스는 bool로의 명시적 변환을 정의하여 해당 인스턴스 't'를 조건문에서 직접 사용할 수 있도록 합니다. 그러나 이 명시적 변환은 다음과 같은 질문을 제기합니다. 캐스트 없이 't'를...

프로그램 작성 2024년 11월 18일에 게시됨
Go에서 http.Request 유형에 포인터가 사용되는 이유는 무엇입니까?
http.Request의 포인터 요구 사항 이해Go 프로그래밍 언어에서 포인터는 대규모 구조를 효율적으로 처리하는 데 필수적입니다. 들어오는 HTTP 요청을 나타내는 http.Request 유형이 그러한 구조의 대표적인 예입니다.Go의 구문에서 포인터는 다른 값의 주소...

프로그램 작성 2024년 11월 18일에 게시됨
실시간 통신을 위해 Go에서 WebSocket 사용
채팅 애플리케이션, 실시간 알림, 협업 도구 등 실시간 업데이트가 필요한 앱을 구축하려면 기존 HTTP보다 더 빠르고 대화형인 통신 방법이 필요합니다. 이것이 바로 WebSockets가 필요한 곳입니다! 오늘은 Go에서 WebSocket을 사용하여 애플리케이션에 실시간...

프로그램 작성 2024년 11월 18일에 게시됨
고유 ID를 유지하고 중복 이름을 처리하면서 PHP에서 두 개의 연관 배열을 어떻게 결합합니까?
PHP에서 연관 배열 결합PHP에서는 두 개의 연관 배열을 단일 배열로 결합하는 것이 일반적인 작업입니다. 다음 요청을 고려하십시오.문제 설명:제공된 코드는 두 개의 연관 배열 $array1 및 $array2를 정의합니다. 목표는 두 배열의 모든 키-값 쌍을 통합하는 ...

프로그램 작성 2024년 11월 18일에 게시됨
Chrome의 실험적 기능에서 JavaScript를 사용하여 브라우저에서 TCP 소켓에 연결하는 방법은 무엇입니까?
JavaScript를 사용하여 브라우저에서 TCP 소켓에 연결브라우저의 JavaScript와 .NET 애플리케이션에서 호스팅하는 TCP 소켓 간에 양방향 통신을 설정하려는 동안 , 현재 웹 기술 환경은 과제를 안고 있습니다.현재 널리 사용되는 브라우저에는 JavaScr...

프로그램 작성 2024년 11월 18일에 게시됨
Go 함수에 패닉이 발생하면 어떻게 오류를 반환하나요?
Go의 Defer에서 반환Go에서 함수 패닉이 발생하는 경우 오류를 반환하려는 문제가 발생했습니다. 다음은 코드에 대한 분석 및 수정 사항입니다.func getReport(filename string) (rep report, err error) { rep.dat...

프로그램 작성 2024년 11월 18일에 게시됨
Bootstrap 4 베타의 열 오프셋은 어떻게 되었나요?
Bootstrap 4 베타: 열 오프셋 제거 및 복원Bootstrap 4는 베타 1 릴리스에서 열 오프셋 방식에 중요한 변경 사항을 도입했습니다. 열이 오프셋되었습니다. 그러나 후속 베타 2 릴리스에서는 이러한 변경 사항이 취소되었습니다.offset-md-*에서 ml-...

프로그램 작성 2024년 11월 17일에 게시됨
Python 코드를 효과적으로 디버깅하는 방법: 실용적인 팁 및 도구
Python 디버깅: 실용적인 팁 및 도구Python 코드 문제를 해결할 때는 원하는 대로 디버깅 기술이 포함된 툴킷을 보유하는 것이 중요합니다. 다음은 몇 가지 매우 효과적인 팁입니다.PDB: 강력한 중단점 도구중단점을 설정하고 코드 실행을 제어하려면 PDB 모듈을 ...

프로그램 작성 2024년 11월 17일에 게시됨
서버를 다시 시작하지 않고 MySQL 쿼리 캐시를 어떻게 지울 수 있습니까?
서버를 재개하지 않고 MySQL 쿼리 캐시 완화MySQL 쿼리 캐시가 제공하는 향상된 성능에도 불구하고 필요한 경우가 발생할 수 있습니다. 서버 운영을 방해하지 않고 삭제됩니다. 이를 달성하기 위한 몇 가지 방법은 다음과 같습니다.쿼리 캐시 재설정명령을 실행하는 사용자...

프로그램 작성 2024년 11월 17일에 게시됨
MySQL은 테이블 및 열 이름의 대소문자 구분을 어떻게 처리합니까?
MySQL의 열 및 테이블 이름 대소문자 구분MySQL의 대소문자 구분 주제는 많은 사용자에게 혼란을 줄 수 있습니다. 적절한 데이터베이스 작동을 보장하고 잠재적인 위험을 방지하려면 열 이름과 테이블 이름 모두의 대소문자 구분을 이해하는 것이 중요합니다.테이블 이름테이...

프로그램 작성 2024년 11월 17일에 게시됨
임시 개체에 대한 Const 참조를 바인딩하면 수명이 연장되는 이유는 무엇입니까?
Const 참조를 임시 개체에 바인딩하면 임시 개체의 수명이 연장되는 이유는 무엇입니까?C 프로그래밍 언어에서는 const 참조를 허용하여 임시 개체의 수명을 연장합니다. 이 동작은 코드 디자인의 성능과 유연성을 향상시킨다고 주장하는 등 많은 논쟁의 대상이 되었습니다....

프로그램 작성 2024년 11월 17일에 게시됨
URL에 '/public'을 노출하지 않고 공유 호스팅의 하위 디렉터리에서 Laravel 프로젝트를 호스팅하는 방법
공유 호스팅에서 Laravel 프로젝트를 호스팅할 때 일반적인 과제 중 하나는 URL에 /public 디렉터리가 필요하지 않은지 확인하는 것입니다. URL을 깨끗하게 유지하면서 Laravel 앱을 하위 디렉터리에 호스팅하는 방법에 대한 단계별 가이드는 다음과 같습니다....

프로그램 작성 2024년 11월 17일에 게시됨
코딩 인터뷰 문제 해결을 위한 궁극적인 가이드
Common Strategies for Coding Interview Questions Two Pointers The two pointers technique is often used to solve array-related problem...

프로그램 작성 2024년 11월 17일에 게시됨