"Si un trabajador quiere hacer bien su trabajo, primero debe afilar sus herramientas." - Confucio, "Las Analectas de Confucio. Lu Linggong"
Página delantera > AI > Los 5 mejores generadores de imágenes de IA de código abierto

Los 5 mejores generadores de imágenes de IA de código abierto

Publicado el 2024-09-02
Navegar:873

Hay docenas de generadores de texto a imágenes con IA gratuitos y de código abierto disponibles en Internet que se especializan en tipos específicos de imágenes. Entonces, revisamos la pila y encontramos los mejores generadores de texto a imagen con IA de código abierto que puedes probar ahora mismo.

1 Craiyon

The 5 Best Open-Source AI Image Generators

Craiyon es uno de los generadores de imágenes de IA de código abierto de más fácil acceso. Está basado en DALL-E Mini, y si bien puedes clonar el repositorio de Github e instalar el modelo localmente en tu computadora, Craiyon parece haber abandonado este enfoque en favor de su sitio web.

El repositorio oficial de Github no se ha actualizado desde junio de 2022, pero el último modelo todavía está disponible de forma gratuita en el sitio oficial de Craiyon. Tampoco hay aplicaciones para Android o iOS.

En términos de funcionalidad, verá todas las opciones habituales que espera de un generador de imágenes de IA. Una vez que ingrese su mensaje y obtenga una imagen, puede usar la función mejorada para obtener una copia de mayor resolución. Hay tres estilos para elegir: Arte, Fotografía y Dibujo. También puedes seleccionar la opción "Ninguno" si quieres que el modelo decida.

The 5 Best Open-Source AI Image Generators

Además, el "Modo experto" le permite incluir palabras negativas, lo que le indica al modelo que evite elementos específicos. También hay una función de predicción de mensajes, que utiliza ChatGPT para ayudar a los usuarios a escribir los mensajes mejores y más detallados posibles. Por último, las funciones de eliminación de fondo impulsadas por IA pueden ayudarle a ahorrar tiempo y esfuerzo al recortar fondos de las imágenes.

Y eso es todo lo que hace Craiyon. No es el modelo de generación de imágenes con IA más sofisticado, pero funciona bien como modelo básico si no quieres algo detallado o realista.

El modelo es de uso gratuito, pero los usuarios gratuitos están limitados a nueve imágenes gratuitas a la vez en un minuto. Puede suscribirse a sus niveles Supporter o Professional (con un precio de $5 y $20 por mes, respectivamente, y facturados anualmente) para no obtener anuncios ni marcas de agua, una generación más rápida y la opción de mantener privadas las imágenes generadas. Un nivel de suscripción personalizado también permite modelos personalizados, integración, soporte dedicado y servidores privados.

2 Stable Diffusion 1.5

Stable Diffusion es quizás uno de los modelos de generación de texto a imagen de código abierto más populares. También alimenta otros modelos, incluidos los tres generadores de imágenes que se mencionan a continuación. Fue lanzado en 2022 y ha tenido muchas implementaciones desde entonces.

The 5 Best Open-Source AI Image Generators

Te ahorraré los detalles demasiado técnicos de cómo funciona el modelo (para lo cual puedes consultar su repositorio oficial de Github), pero el modelo es fácil de instalar incluso para principiantes y funciona bien. siempre que tengas una GPU dedicada con al menos 4 GB de memoria. También puede acceder a Stable Diffusion en línea y lo tenemos cubierto si desea ejecutar Stable Diffusion en una Mac.

Hay varios puntos de control (considérelos versiones) disponibles para usar en Difusión estable. Si bien probamos la versión 1.5, la versión 2.1 también está en desarrollo activo y es más precisa.

The 5 Best Open-Source AI Image Generators

Ejecutar el modelo también es bastante fácil. Lo probamos con la interfaz de usuario web AUTOMATIC1111 Stable Diffusion y todos los controles y parámetros funcionan bien. También es bastante resistente a NSFW, cortesía de la base de datos LAION-5B en la que se entrenó el modelo (aunque no es perfecta, claro está). Si bien el tiempo de generación variará según su hardware, puede esperar que sus imágenes sean detalladas y realistas incluso con indicaciones básicas.

3 DreamShaper

DreamShaper es un modelo de generación de imágenes basado en Stable Diffusion. Fue pensado como una alternativa de código abierto a MidJourney y se centra en el fotorrealismo en las imágenes generadas, aunque puede manejar estilos de anime y pintura igual de bien con algunos ajustes.

El modelo es más capaz que Stable Diffusion, lo que permite a los usuarios más libertad sobre el resultado final, desde mejoras relámpago hasta restricciones NSFW más flexibles. Ejecutar el modelo también es fácil, con una versión descargable previamente entrenada disponible en línea para acceso local y una gran cantidad de sitios web, incluidos Sinkin.ai, RandomSeed y Mage.space (requiere una suscripción básica) que le permiten ejecutar el modelo con Aceleración de GPU.

The 5 Best Open-Source AI Image Generators

Como probablemente ya habrás adivinado, las imágenes generadas por DreamShaper tienden a parecer más realistas en comparación con Stable Diffusion. Incluso si ejecuta el mismo mensaje en ambos modelos, el modelo DreamShaper probablemente será más realista, detallado y mejor iluminado.

Esto es especialmente cierto para retratos o personajes, algo que encontré que Stable Diffusion faltaba en comparación con el mismo mensaje. Si sus imágenes se vuelven demasiado realistas, aquí hay cuatro formas de identificar una imagen generada por IA.

Tampoco necesitas una PC gigante para ejecutar el modelo. Mi GTX 1650Ti con 4GB VRAM ejecutó el modelo perfectamente. El tiempo de generación fue un poco más largo, pero no pareció afectar la producción real. Dicho esto, es posible que necesites GPU con más VRAM para ejecutar DreamShaper XL, que se basa en el modelo Stable Diffusion XL.

4 InvokeAI

Invoke AI es otro modelo de generación de imágenes basado en IA basado en Stable Diffusion, con una versión XL basada en Stable Diffusion XL. También tiene su propia interfaz de usuario web y de línea de comandos, lo que significa que no tendrá que saltarse obstáculos con cosas como la interfaz de usuario web de Stable Diffusion.

The 5 Best Open-Source AI Image Generators

El modelo se centra en permitir a los usuarios crear imágenes basadas en su propiedad intelectual con flujos de trabajo personalizados. InvokeAI es uno de los mejores modelos de generación de imágenes de IA de código abierto para entrenar modelos personalizados y trabajar con propiedad intelectual.

Su repositorio oficial de Github enumera dos métodos de instalación: instalar a través del instalador de InvokeAI o usar PyPI si se siente cómodo con una terminal y Python y necesita más control sobre los paquetes instalados con el modelo.

Sin embargo, el control adicional trae algunas limitaciones, en particular requisitos de hardware más estrictos. InvokeAI recomienda una GPU dedicada con al menos 4 GB de memoria, y se recomiendan de seis a ocho GB para ejecutar la variante XL. Los requisitos de VRAM se aplican tanto a las GPU AMD como a Nvidia. También necesitarás al menos 12 GB de RAM y 12 GB de espacio libre en disco para el modelo, sus dependencias y Python.

The 5 Best Open-Source AI Image Generators

Si bien la documentación no recomienda las GPU GTX Serie 10 y Serie 16 de Nvidia por su falta de memoria de video, el instalador proporcionado funcionó bien. Si bien su kilometraje puede variar, si tiene una GPU de gama baja, espere más tiempo para ver sus indicaciones convertidas en imágenes. Finalmente, si estás en Windows, solo puedes usar una GPU Nvidia, ya que actualmente no hay soporte para GPU AMD.

Para la parte de generación de imágenes, el modelo tiende a inclinarse más hacia estilos artísticos que al fotorrealismo. Por supuesto, puede entrenar el modelo en su conjunto de datos y hacer que genere imágenes más cercanas a lo que desea, incluso si se trata de imágenes fotorrealistas, especialmente si trabaja en diseño de productos, arquitectura o espacios comerciales. Sin embargo, una cosa importante a tener en cuenta es que InvokeAI es principalmente un motor de generación de imágenes, lo que significa que probablemente tendrá que usar sus propios modelos para obtener los mejores resultados (que se encuentran fácilmente a través del administrador de modelos proporcionado en la interfaz web) como valor predeterminado. El modelo es bastante similar al propio Stable Diffusion.

5 Openjourney

Openjourney es un modelo de generación de imágenes de IA gratuito y de código abierto basado una vez más en Stable Diffusion. Si te preguntas por qué el modelo se llama Openjourney, es porque fue entrenado con imágenes de Midjourney y puede imitar su estilo en las imágenes que genera.

PromptHero, la compañía detrás de Openjourney, le permite probar el modelo junto con otros modelos, incluidos Stable Diffusion (versiones 1.5 y 2), DreamShaper y Realistic Vision. Al registrarte, obtienes 25 créditos gratis (un crédito por cada imagen generada), después de lo cual debes suscribirte a su nivel de suscripción Pro, que cuesta $9 al mes y te da acceso a 300 créditos cada mes con otras características exclusivas.

The 5 Best Open-Source AI Image Generators

Sin embargo, si desea ejecutarlo localmente y de forma gratuita, puede descargar el archivo del modelo desde HuggingFace y ejecutarlo usando la interfaz de usuario web de Stable Diffusion. Openjourney es también el segundo modelo de generación de imágenes de IA más descargado en HuggingFace, justo detrás de Stable Diffusion.

Openjourney no enumera ningún requisito de hardware específico para ejecutar el modelo localmente en su sitio web, pero puede esperar requisitos de hardware similares a los de Stable Diffusion. Esto significa una GPU dedicada con 4 GB de VRAM, 16 GB de RAM y alrededor de 12 a 15 GB de espacio libre en su computadora para guardar el modelo y sus dependencias.

The 5 Best Open-Source AI Image Generators

Las imágenes generadas por Openjourney tienden a tener un equilibrio entre fotorrealismo y arte a menos que se especifique lo contrario. Si buscas un modelo versátil y prefieres la apariencia de Midjourney sin pagar la suscripción, Openjourney es una de las mejores opciones.

Declaración de liberación Este artículo se reproduce en: https://www.makeuseof.com/best-open-source-ai-image-generators/ Si hay alguna infracción, comuníquese con [email protected] para eliminarla.
Último tutorial Más>

Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.

Copyright© 2022 湘ICP备2022001581号-3