”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 在开发中使用开源人工智能模型

在开发中使用开源人工智能模型

发布于2024-11-09
浏览:226

El uso de los modelos de IA open source en el desarrollo

去年,大量人工智能工具的出现让用户的生活变得更加轻松,无论是图像生成还是聊天机器人,甚至扩展到执行庞大而专业的工具进程。

我一直在研究、学习和测试许多这些工具,从 chatgpt、gemini 到 dall-e 或 midjourney,它们都工作得很好,但是当我想用这些工具扩展我的应用程序时,我发现它们没有免费或开放替代源。

这让我的研究更进一步,我遇到了稳定扩散ui(图像生成,https://github.com/AUTOMATIC1111/stable-diffusion-webui)和* ollama *(Chatbot,https://ollama.com/),两者都是开源工具,允许您将服务作为 API 运行以使用它从我们的任何应用程序中,我已经通过开源替代方案更进一步了,但为了使其发挥作用,我必须保持这些工具运行以供我们的应用程序使用。

要了解如何将其引入我们的应用程序,了解这些工具的工作原理非常重要,基本上它们的作用是使用带有“safetensors”扩展名的 LLM 或大型语言模型文件,这些模型经过训练可以执行根据训练者的需要提供不同的功能(例如:图像生成、翻译、代码开发、聊天机器人等)。

通过了解一些 LLM 模型和“safetensors”文件,我们得到以下问题:如何在我的应用程序中使用这些文件,这就是 HugginFace 的用武之地,它是一个开源人工智能网站/数据库模型,他们为 python 创建了自己的库,其中有 2 个非常有用的组件,可以满足我们想要的“Transformers”和“Diffusers”。

*Transformers *(https://huggingface.co/docs/transformers/index) 是允许我们使用任何专用文本模型的组件,例如将音频转换为文本,反之亦然,聊天框作为元火焰等。

进口变压器

import torch

model_id = "meta-llama/Llama-3.1-8B"

pipeline = transformers.pipeline(
    "text-generation", model=model_id, model_kwargs={"torch_dtype": torch.bfloat16}, device_map="auto"
)

pipeline("Hey how are you doing today?")

Diffusers (https://huggingface.co/docs/diffusers/index) 是允许我们使用任何专门用于图像生成的模型的组件,例如稳定扩散。

from diffusers import AutoPipelineForText2Image
import torch

pipe = AutoPipelineForText2Image.from_pretrained("stabilityai/sdxl-turbo", torch_dtype=torch.float16, variant="fp16")
pipe.to("cuda")

prompt = "A cinematic shot of a baby racoon wearing an intricate italian priest robe."

image = pipe(prompt=prompt, num_inference_steps=1, guidance_scale=0.0).images[0]

此过程称为 LLM 模型推理,从这里基于此信息,您可以开始使用 Python 在不同的应用程序中应用人工智能。

值得注意的是,我也尝试过将模型推理与另一种语言(例如nodejs)一起使用,事实是它在Python上的效果不如Python,但重要的是要提到LLM需要强大的硬件模型推理,以便您可以通过使用 ChatGPT 或 Gemini API 节省购买合适硬件的费用。

这就是我的第一篇文章,我希望我在软件开发中使用LLM模型的道路可以帮助您跳过这条道路上的步骤。

版本声明 本文转载于:https://dev.to/miguelbc7/el-uso-de-los-modelos-de-ia-open-source-en-el-desarrollo-3j9h?1如有侵犯,请联系[email protected]删除
最新教程 更多>
  • 大批
    大批
    方法是可以在对象上调用的 fns 数组是对象,因此它们在 JS 中也有方法。 slice(begin):将数组的一部分提取到新数组中,而不改变原始数组。 let arr = ['a','b','c','d','e']; // Usecase: Extract till index p...
    编程 发布于2024-11-18
  • 如何使用 MySQL 查找今天生日的用户?
    如何使用 MySQL 查找今天生日的用户?
    如何使用 MySQL 识别今天生日的用户使用 MySQL 确定今天是否是用户的生日涉及查找生日匹配的所有行今天的日期。这可以通过一个简单的 MySQL 查询来实现,该查询将存储为 UNIX 时间戳的生日与今天的日期进行比较。以下 SQL 查询将获取今天有生日的所有用户: FROM USERS ...
    编程 发布于2024-11-18
  • 除了“if”语句之外:还有哪些地方可以在不进行强制转换的情况下使用具有显式“bool”转换的类型?
    除了“if”语句之外:还有哪些地方可以在不进行强制转换的情况下使用具有显式“bool”转换的类型?
    无需强制转换即可上下文转换为 bool您的类定义了对 bool 的显式转换,使您能够在条件语句中直接使用其实例“t”。然而,这种显式转换提出了一个问题:“t”在哪里可以在不进行强制转换的情况下用作 bool?上下文转换场景C 标准指定了四种值可以根据上下文转换为 bool 的主要场景:语句:if、w...
    编程 发布于2024-11-18
  • 为什么 Go 中的 http.Request 类型使用指针?
    为什么 Go 中的 http.Request 类型使用指针?
    理解http.Request中的指针要求在Go编程语言中,指针对于有效处理大型结构至关重要。 http.Request 类型表示传入的 HTTP 请求,是这种结构的一个主要示例。在 Go 的语法中,指针是一种存储另一个值的地址的数据类型。当参数通过指针传递时,函数内对该参数所做的任何更改都会全局反映...
    编程 发布于2024-11-18
  • 在 Go 中使用 WebSocket 进行实时通信
    在 Go 中使用 WebSocket 进行实时通信
    构建需要实时更新的应用程序(例如聊天应用程序、实时通知或协作工具)需要一种比传统 HTTP 更快、更具交互性的通信方法。这就是 WebSockets 发挥作用的地方!今天,我们将探讨如何在 Go 中使用 WebSocket,以便您可以向应用程序添加实时功能。 在这篇文章中,我们将介绍: WebSoc...
    编程 发布于2024-11-18
  • 如何在 PHP 中组合两个关联数组,同时保留唯一 ID 并处理重复名称?
    如何在 PHP 中组合两个关联数组,同时保留唯一 ID 并处理重复名称?
    在 PHP 中组合关联数组在 PHP 中,将两个关联数组组合成一个数组是一项常见任务。考虑以下请求:问题描述:提供的代码定义了两个关联数组,$array1 和 $array2。目标是创建一个新数组 $array3,它合并两个数组中的所有键值对。 此外,提供的数组具有唯一的 ID,而名称可能重合。要求...
    编程 发布于2024-11-18
  • 如何在 Chrome 实验功能中使用 JavaScript 从浏览器连接到 TCP 套接字?
    如何在 Chrome 实验功能中使用 JavaScript 从浏览器连接到 TCP 套接字?
    使用 JavaScript 从浏览器连接到 TCP 套接字当您寻求在浏览器的 JavaScript 和 .NET 应用程序托管的 TCP 套接字之间建立双向通信时,当前的 Web 技术格局提出了挑战。到目前为止,流行的浏览器缺乏 JavaScript 的标准化套接字 API。然而,有希望的进展正在发...
    编程 发布于2024-11-18
  • 如果 Go 函数发生紧急情况,如何返回错误?
    如果 Go 函数发生紧急情况,如何返回错误?
    从 Go 中的 Defer 返回您遇到了这样的问题:如果 Go 中的函数发生紧急情况,您希望返回错误。这是对您的代码的分析和修复:func getReport(filename string) (rep report, err error) { rep.data = make(map[str...
    编程 发布于2024-11-18
  • Bootstrap 4 Beta 中的列偏移发生了什么?
    Bootstrap 4 Beta 中的列偏移发生了什么?
    Bootstrap 4 Beta:列偏移的删除和恢复Bootstrap 4 在其 Beta 1 版本中引入了重大更改柱子偏移了。然而,随着 Beta 2 的后续发布,这些变化已经逆转。从 offset-md-* 到 ml-auto在 Bootstrap 4 Beta 1 中, offset-md-*...
    编程 发布于2024-11-17
  • 如何有效调试 Python 代码:实用技巧和工具
    如何有效调试 Python 代码:实用技巧和工具
    Python 调试:实用技巧和工具在对 Python 代码进行故障排除时,拥有一个可供使用的调试技术工具包至关重要。以下是一些非常有效的技巧:PDB:强大的断点工具利用 PDB 模块设置断点并获得对代码执行的控制。通过插入 pdb.set_trace(),可以在特定点暂停执行并检查程序的当前状态:i...
    编程 发布于2024-11-17
  • 如何在不重启服务器的情况下清除MySQL查询缓存?
    如何在不重启服务器的情况下清除MySQL查询缓存?
    在不恢复服务器的情况下减轻 MySQL 查询缓存尽管 MySQL 查询缓存提供了更高的性能,但在需要时可能会出现这种情况可以在不中断服务器运行的情况下进行清除。以下是实现此目的的一些方法:重置查询缓存如果执行命令的用户具有重新加载权限,则可以使用以下命令显式删除查询缓存命令:RESET QUERY ...
    编程 发布于2024-11-17
  • MySQL 如何处理表名和列名的区分大小写?
    MySQL 如何处理表名和列名的区分大小写?
    MySQL 中列名和表名的大小写敏感度MySQL 中的大小写敏感度主题可能会让许多用户感到困惑。了解列名和表名的大小写敏感性对于确保正确的数据库操作和避免潜在的陷阱至关重要。表名表名是否区分大小写取决于在运行 MySQL 服务器的操作系统上。在基于 Unix 的系统(例如 Linux)上,表名称区分...
    编程 发布于2024-11-17
  • 为什么将常量引用绑定到临时对象会延长其生命周期?
    为什么将常量引用绑定到临时对象会延长其生命周期?
    为什么将常量引用绑定到临时对象会延长临时对象的生命周期?C 编程语言允许常量引用来延长临时对象的生命周期。这种行为一直是很多争论的主题,一些人认为它可以提高代码设计的性能和灵活性。这种语言功能的起源可以追溯到 1993 年,当时它被提议作为以下问题的解决方案:绑定到引用时临时变量的处理不一致。在没有...
    编程 发布于2024-11-17
  • 如何在共享主机的子目录中托管 Laravel 项目而不在 URL 中暴露“/public”
    如何在共享主机的子目录中托管 Laravel 项目而不在 URL 中暴露“/public”
    在共享主机上托管 Laravel 项目时,一个常见的挑战是确保 URL 不需要 /public 目录。这是在子目录中托管 Laravel 应用程序同时保持 URL 干净的分步指南。 第 1 步:将 Laravel 项目上传到服务器 登录您的托管帐户并访问您的文件管理器。 导航到 pu...
    编程 发布于2024-11-17
  • 编码面试中解决问题的终极指南
    编码面试中解决问题的终极指南
    Common Strategies for Coding Interview Questions Two Pointers The two pointers technique is often used to solve array-related problem...
    编程 发布于2024-11-17

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3