Os 5 principais geradores de imagens de IA de código aberto

Primeira página > IA > Os 5 melhores geradores de imagens de IA de código aberto

Os 5 melhores geradores de imagens de IA de código aberto

Publicado em 2024-09-02

Navegar:355

Existem dezenas de geradores de texto para imagem de IA gratuitos e de código aberto disponíveis na Internet, especializados em tipos específicos de imagens. Então, vasculhamos a pilha e encontramos os melhores geradores de texto para imagem de IA de código aberto que você pode experimentar agora.

1 Craiyon

The 5 Best Open-Source AI Image Generators

Craiyon é um dos geradores de imagens de IA de código aberto mais facilmente acessíveis. É baseado no DALL-E Mini e, embora você possa clonar o repositório Github e instalar o modelo localmente em seu computador, a Craiyon parece ter abandonado essa abordagem em favor de seu site.

O repositório oficial do Github não é atualizado desde junho de 2022, mas o modelo mais recente ainda está disponível gratuitamente no site oficial do Craiyon. Também não há aplicativos para Android ou iOS.

Em termos de funcionalidade, você verá todas as opções usuais que você espera de um gerador de imagens de IA. Depois de inserir o prompt e obter uma imagem, você pode usar o recurso de upscale para obter uma cópia de resolução mais alta. Existem três estilos para escolher: Arte, Foto e Desenho. Você também pode selecionar a opção “Nenhum” se quiser que o modelo decida.

Além disso, o "Modo Especialista" permite incluir palavras negativas, o que instrui o modelo a evitar itens específicos. Há também um recurso de previsão de prompts, que usa ChatGPT para ajudar os usuários a escrever os prompts melhores e mais detalhados possíveis. Por último, os recursos de remoção de fundo com tecnologia de IA podem ajudá-lo a economizar tempo e esforço cortando fundos de imagens.

E isso é tudo que Craiyon faz. Não é o modelo de geração de imagens de IA mais sofisticado, mas funciona bem como modelo básico se você não quiser algo detalhado ou realista.

O uso do modelo é gratuito, mas os usuários gratuitos estão limitados a nove imagens gratuitas por vez em um minuto. Você pode se inscrever nos níveis Apoiador ou Profissional (com preços de US$ 5 e US$ 20 por mês, respectivamente, e cobrados anualmente) para não obter anúncios ou marcas d'água, geração mais rápida e a opção de manter privadas as imagens geradas. Um nível de assinatura personalizado também permite modelos personalizados, integração, suporte dedicado e servidores privados.

2 Stable Diffusion 1.5

Stable Diffusion é talvez um dos modelos de geração de texto para imagem de código aberto mais populares. Ele também alimenta outros modelos, incluindo os três geradores de imagens mencionados abaixo. Foi lançado em 2022 e teve muitas implementações desde então.

Vou poupar vocês dos detalhes excessivamente técnicos de como o modelo funciona (para os quais você pode conferir o repositório oficial do Github), mas o modelo é fácil de instalar, mesmo para iniciantes e funciona bem contanto que você tenha uma GPU dedicada com pelo menos 4 GB de memória. Você também pode acessar o Stable Diffusion online, e nós ajudamos você se quiser executar o Stable Diffusion em um Mac.

Existem vários pontos de verificação (considere-os versões) disponíveis para uso na Difusão Estável. Embora tenhamos testado a versão 1.5, a versão 2.1 também está em desenvolvimento ativo e é mais precisa.

Executar o modelo também é bastante fácil. Nós o testamos com a interface de usuário da web AUTOMATIC1111 Stable Diffusion e todos os controles e parâmetros funcionam bem. Também é bastante à prova de NSFW, cortesia do banco de dados LAION-5B no qual o modelo treinou (embora não seja perfeito, veja bem). Embora o tempo de geração varie de acordo com o seu hardware, você pode esperar que suas imagens sejam detalhadas e realistas, mesmo com instruções básicas.

3 DreamShaper

DreamShaper é um modelo de geração de imagens baseado em Difusão Estável. Foi concebido como uma alternativa de código aberto ao MidJourney e foca no fotorrealismo nas imagens geradas, embora também possa lidar com estilos de anime e pintura com alguns ajustes.

O modelo é mais capaz do que o Stable Diffusion, permitindo aos usuários mais liberdade sobre o resultado final, variando de melhorias relâmpago a restrições NSFW mais flexíveis. Executar o modelo também é fácil, com uma versão pré-treinada para download disponível online para acesso local e uma série de sites, incluindo Sinkin.ai, RandomSeed e Mage.space (requer uma assinatura básica) que permitem executar o modelo com Aceleração de GPU.

Como você provavelmente já deve imaginar, as imagens geradas pelo DreamShaper tendem a parecer mais realistas em comparação com o Stable Diffusion. Mesmo se você executar o mesmo prompt em ambos os modelos, o modelo DreamShaper provavelmente será mais realista, detalhado e melhor iluminado.

Isso é especialmente verdadeiro para retratos ou personagens, algo que achei que faltava no Stable Diffusion em comparação com o mesmo prompt. Se suas imagens se tornarem muito realistas, aqui estão quatro maneiras de identificar uma imagem gerada por IA.

Você também não precisa de um PC gigante para executar o modelo. Minha GTX 1650Ti com 4GB VRAM rodou o modelo perfeitamente. O tempo de geração foi um pouco mais longo, mas não pareceu afetar a produção real. Dito isso, você pode precisar de GPUs com mais VRAM para executar o DreamShaper XL, que é baseado no modelo Stable Diffusion XL.

4 InvokeAI

Invoke AI é outro modelo de geração de imagens baseado em IA baseado em Stable Diffusion, com uma versão XL baseada em Stable Diffusion XL. Ele também tem sua própria interface de usuário da web e de linha de comando, o que significa que você não terá que se preocupar com coisas como a interface da web do Stable Diffusion.

O modelo se concentra em permitir que os usuários criem recursos visuais com base em sua propriedade intelectual com fluxos de trabalho personalizados. InvokeAI é um dos melhores modelos de geração de imagens de IA de código aberto para treinar modelos personalizados e trabalhar com propriedade intelectual.

Seu repositório oficial do Github lista dois métodos de instalação: instalação por meio do instalador do InvokeAI ou usando PyPI se você estiver confortável com um terminal e Python e precisar de mais controle sobre os pacotes instalados com o modelo.

No entanto, o controle extra traz algumas limitações, principalmente requisitos de hardware mais rígidos. A InvokeAI recomenda uma GPU dedicada com pelo menos 4 GB de memória, sendo recomendados de seis a oito GB para executar a variante XL. Os requisitos de VRAM se aplicam às GPUs AMD e Nvidia. Você também precisará de pelo menos 12 GB de RAM e 12 GB de espaço livre em disco para o modelo, suas dependências e Python.

Embora a documentação não recomende as GPUs GTX 10 Series e 16 Series da Nvidia por falta de memória de vídeo, o instalador fornecido funcionou perfeitamente. Embora sua milhagem possa variar, se você estiver em uma GPU de baixo custo, espere mais para ver seus prompts sendo transformados em imagens. Finalmente, se você estiver no Windows, só poderá usar uma GPU Nvidia, pois atualmente não há suporte para GPUs AMD.

Para a parte de geração de imagens, o modelo tende a se inclinar mais para estilos artísticos do que para o fotorrealismo. Claro, você pode treinar o modelo em seu conjunto de dados e fazer com que ele gere imagens mais próximas do que você deseja, mesmo que isso envolva imagens fotorrealistas, especialmente se você estiver trabalhando em design de produtos, arquitetura ou espaços de varejo. No entanto, uma coisa importante a ter em mente é que o InvokeAI é principalmente um mecanismo de geração de imagens, o que significa que você provavelmente terá que usar seus próprios modelos para obter os melhores resultados (facilmente encontrados através do gerenciador de modelos fornecido na interface da web) como padrão. o modelo é bastante semelhante ao próprio Stable Diffusion.

5 Openjourney

Openjourney é um modelo de geração de imagens de IA gratuito e de código aberto baseado mais uma vez em Stable Diffusion. Se você está se perguntando por que o modelo se chama Openjourney, é porque ele foi treinado em imagens Midjourney e pode imitar seu estilo nas imagens que gera.

PromptHero, a empresa por trás do Openjourney, permite testar o modelo junto com outros modelos, incluindo Stable Diffusion (versões 1.5 e 2), DreamShaper e Realistic Vision. Ao se inscrever, você ganha 25 créditos grátis (um crédito para cada imagem gerada), após os quais você deve assinar o nível de assinatura Pro, que custa US$ 9 por mês e dá acesso a 300 créditos por mês com outros recursos exclusivos.

No entanto, se quiser executá-lo localmente e gratuitamente, você pode baixar o arquivo de modelo do HuggingFace e executá-lo usando a interface da web do Stable Diffusion. Openjourney também é o segundo modelo de geração de imagens de IA mais baixado no HuggingFace, logo atrás do Stable Diffusion.

Openjourney não lista nenhum requisito de hardware específico para executar o modelo localmente em seu site, mas você pode esperar requisitos de hardware semelhantes ao Stable Diffusion. Isso significa uma GPU dedicada com 4 GB de VRAM, 16 GB de RAM e cerca de 12 a 15 GB de espaço livre em seu computador para salvar o modelo e suas dependências.

Imagens geradas pelo Openjourney tendem a ser equilibradas entre fotorrealismo e arte, a menos que especificado de outra forma. Se você procura um modelo versátil e prefere o visual do Midjourney sem pagar pela assinatura, o Openjourney é uma das melhores opções.

Declaração de lançamento Este artigo foi reproduzido em: https://www.makeuseof.com/best-open-source-ai-image-generators/ Se houver alguma violação, entre em contato com [email protected] para excluí-lo

Tutorial mais recente Mais>

As 5 principais ferramentas de orçamento inteligentes da IA
desbloqueando a liberdade financeira com a IA: os principais aplicativos de orçamento na Índia Você está cansado de se perguntar constantemente par...

IA Postado em 2025-04-17
Explicação detalhada da função do Excel Sumproduct - Escola de Análise de Dados
Função Sumproduct do Excel: uma análise de análise de dados desbloqueia o poder da função Sumproduct do Excel para análise de dados simplificada. E...

IA Postado em 2025-04-16
Pesquisas aprofundadas estão totalmente abertas, os benefícios do usuário do ChatGPT Plus
Pesquisa profunda do OpenAI: um divisor de águas para pesquisa de IA o OpenAI lançou pesquisas profundas para todos os assinantes ChatGPT Plus, pro...

IA Postado em 2025-04-16
Amazon Nova Today Experiência e Revisão Real - Analytics Vidhya
Amazon revela a Nova: modelos de fundação de ponta para AI aprimorada e criação de conteúdo A Amazon Re: Invent 2024 Event mostrou Nova, seu conjun...

IA Postado em 2025-04-16
5 maneiras de usar a função de tarefa de tempo de chatgpt
As novas tarefas agendadas do chatgpt: automatize seu dia com ai O ChatGPT apresentou recentemente um recurso de mudança de jogo: tarefas agendadas...

IA Postado em 2025-04-16
Qual dos três chatbots da IA responde ao mesmo aviso é o melhor?
com opções como Claude, Chatgpt e Gemini, escolher um chatbot pode parecer esmagador. Para ajudar a cortar o ruído, coloquei todos os três à prova...

IA Postado em 2025-04-15
ChatGPT é suficiente, nenhuma máquina de chat de IA dedicada é necessária
Em um mundo com novos chatbots de AI lançados diariamente, pode ser esmagador decidir qual é o "único" certo. Mas, na minha experiência, o ...

IA Postado em 2025-04-14
Momento indiano da IA: competição com a China e os Estados Unidos em IA generativa
Ambições da AI da Índia: uma atualização de 2025 Com a China e os EUA investindo fortemente em IA generativa, a Índia está acelerando suas próprias...

IA Postado em 2025-04-13
Automatando a importação de CSV para PostgreSQL usando o fluxo de ar e o docker
Este tutorial demonstra a criação de um pipeline de dados robusto usando o Apache Airflow, Docker e PostgreSQL para automatizar a transferência de da...

IA Postado em 2025-04-12
Algoritmos de inteligência de enxames: três implementações do Python
Imagine watching a flock of birds in flight. There's no leader, no one giving directions, yet they swoop and glide together in perfect harmony. It may...

IA Postado em 2025-03-24
Como tornar seu LLM mais preciso com pano e ajuste fino
Imagine studying a module at university for a semester. At the end, after an intensive learning phase, you take an exam – and you can recall th...

IA Postado em 2025-03-24
O que é o Google Gemini? Tudo o que você precisa saber sobre o rival ChatGPT do Google
Google recently released its new Generative AI model, Gemini. It results from a collaborative effort by a range of teams at Google, including members ...

IA Postado em 2025-03-23
Guia sobre solicitação com DSPY
dspy: uma estrutura declarativa para a construção e melhoria de aplicativos LLM DSPY (programas de idiomas auto-improvantes declarativos) revolucio...

IA Postado em 2025-03-22
Automatize o blog para o tópico do Twitter
Este artigo detalha automatização da conversão de conteúdo de formato longo (como postagens de blog) em tópicos envolventes no Twitter usando o gemin...

IA Postado em 2025-03-11
Sistema imunológico artificial (AIS): um guia com exemplos de python
Este artigo explora sistemas imunológicos artificiais (AIS), modelos computacionais inspirados na notável capacidade do sistema imunológico humano de...

IA Postado em 2025-03-04

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo