Die 5 besten Open-Source-KI-Bildgeneratoren

Titelseite > KI > Die 5 besten Open-Source-KI-Bildgeneratoren

Die 5 besten Open-Source-KI-Bildgeneratoren

Veröffentlicht am 02.09.2024

Durchsuche:847

Im Internet sind Dutzende kostenloser und quelloffener KI-Text-zu-Bild-Generatoren verfügbar, die auf bestimmte Arten von Bildern spezialisiert sind. Also haben wir den Stapel durchgesehen und die besten Open-Source-KI-Text-zu-Bild-Generatoren gefunden, die Sie jetzt ausprobieren können.

1 Craiyon

The 5 Best Open-Source AI Image Generators

Craiyon ist einer der am einfachsten zugänglichen Open-Source-KI-Bildgeneratoren. Es basiert auf DALL-E Mini, und während Sie das Github-Repository klonen und das Modell lokal auf Ihrem Computer installieren können, scheint Craiyon diesen Ansatz zugunsten seiner Website aufgegeben zu haben.

Das offizielle Github-Repository wurde seit Juni 2022 nicht mehr aktualisiert, aber das neueste Modell ist weiterhin kostenlos auf der offiziellen Craiyon-Website verfügbar. Es gibt auch keine Android- oder iOS-Apps.

Hinsichtlich der Funktionalität finden Sie alle üblichen Optionen vor, die Sie von einem KI-Bildgenerator erwarten. Sobald Sie Ihre Eingabeaufforderung eingegeben und ein Bild erhalten haben, können Sie die Hochskalierungsfunktion verwenden, um eine Kopie mit höherer Auflösung zu erhalten. Es stehen drei Stile zur Auswahl: Kunst, Foto und Zeichnung. Sie können auch die Option „Keine“ auswählen, wenn Sie möchten, dass das Modell entscheidet.

Darüber hinaus können Sie im „Expertenmodus“ negative Wörter einfügen, die dem Modell mitteilen, bestimmte Elemente zu meiden. Es gibt auch eine Funktion zur Vorhersage von Eingabeaufforderungen, die ChatGPT verwendet, um Benutzern dabei zu helfen, die bestmöglichen und detailliertesten Eingabeaufforderungen zu verfassen. Schließlich können Ihnen die KI-gestützten Funktionen zum Entfernen des Hintergrunds dabei helfen, Zeit und Aufwand beim Zuschneiden von Hintergründen aus Bildern zu sparen.

Und das ist alles, was Craiyon tut. Es handelt sich nicht um das ausgefeilteste Modell zur KI-Bilderzeugung, aber es eignet sich gut als Basismodell, wenn Sie nichts Detailliertes oder Realistisches wünschen.

Die Nutzung des Modells ist kostenlos, Nutzer der kostenlosen Version sind jedoch auf neun kostenlose Bilder gleichzeitig innerhalb einer Minute beschränkt. Sie können die Stufen „Supporter“ oder „Professional“ abonnieren (zum Preis von 5 bzw. 20 US-Dollar pro Monat und jährlicher Abrechnung), um keine Werbung oder Wasserzeichen, eine schnellere Generierung und die Option zu erhalten, Ihre generierten Bilder privat zu halten. Eine benutzerdefinierte Abonnementstufe ermöglicht außerdem benutzerdefinierte Modelle, Integration, dedizierten Support und private Server.

2 Stable Diffusion 1.5

Stable Diffusion ist vielleicht eines der beliebtesten Open-Source-Modelle zur Text-zu-Bild-Generierung. Es versorgt auch andere Modelle mit Strom, darunter die drei unten genannten Bildgeneratoren. Es wurde im Jahr 2022 veröffentlicht und hat seitdem viele Implementierungen erfahren.

Ich erspare Ihnen die allzu technischen Details zur Funktionsweise des Modells (für die Sie sich das offizielle Github-Repository ansehen können), aber das Modell ist selbst für absolute Anfänger einfach zu installieren und funktioniert gut solange Sie über eine dedizierte GPU mit mindestens 4 GB Speicher verfügen. Sie können auch online auf Stable Diffusion zugreifen, und wir sind für Sie da, wenn Sie Stable Diffusion auf einem Mac ausführen möchten.

Es stehen mehrere Prüfpunkte (betrachten Sie sie als Versionen) zur Verfügung, die für die stabile Diffusion verwendet werden können. Während wir Version 1.5 getestet haben, befindet sich Version 2.1 ebenfalls in der aktiven Entwicklung und ist präziser.

Das Ausführen des Modells ist ebenfalls recht einfach. Wir haben es mit der Web-Benutzeroberfläche AUTOMATIC1111 Stable Diffusion getestet und alle Steuerelemente und Parameter funktionieren gut. Dank der LAION-5B-Datenbank, auf der das Modell trainiert hat, ist es auch ziemlich NSFW-sicher (obwohl sie wohlgemerkt nicht perfekt ist). Während die Generierungszeit selbst je nach Hardware variieren kann, können Sie davon ausgehen, dass Ihre Bilder auch bei einfachen Eingabeaufforderungen detailliert und realistisch sind.

3 DreamShaper

DreamShaper ist ein Bilderzeugungsmodell, das auf Stable Diffusion basiert. Es war als Open-Source-Alternative zu MidJourney gedacht und konzentriert sich auf Fotorealismus in den generierten Bildern, obwohl es mit ein paar Optimierungen genauso gut mit Anime- und Malstilen umgehen kann.

Das Modell ist leistungsfähiger als Stable Diffusion und bietet Benutzern mehr Freiheit bei der endgültigen Ausgabe, die von blitzschnellen Verbesserungen bis hin zu lockereren NSFW-Beschränkungen reicht. Das Ausführen des Modells ist ebenfalls einfach, da eine herunterladbare, vorab trainierte Version online für den lokalen Zugriff verfügbar ist und eine Vielzahl von Websites, darunter Sinkin.ai, RandomSeed und Mage.space (erfordert ein Basisabonnement), mit denen Sie das Modell ausführen können GPU-Beschleunigung.

Wie Sie wahrscheinlich inzwischen erraten haben, sehen mit DreamShaper generierte Bilder im Vergleich zu Stable Diffusion tendenziell realistischer aus. Selbst wenn Sie auf beiden Modellen die gleiche Eingabeaufforderung ausführen, wird das DreamShaper-Modell wahrscheinlich realistischer, detaillierter und besser beleuchtet sein.

Dies gilt insbesondere für Porträts oder Charaktere, was meiner Meinung nach im Vergleich zur gleichen Eingabeaufforderung an der stabilen Diffusion mangelt. Wenn Ihre Bilder zu realistisch werden, gibt es vier Möglichkeiten, ein KI-generiertes Bild zu erkennen.

Sie benötigen auch keinen riesigen PC, um das Modell auszuführen. Meine GTX 1650Ti mit 4 GB VRAM lief mit dem Modell einwandfrei. Die Generierungszeit war etwas länger, aber es schien keinen Einfluss auf die tatsächliche Ausgabe zu haben. Allerdings benötigen Sie möglicherweise GPUs mit mehr VRAM, um DreamShaper XL auszuführen, das auf dem Stable Diffusion XL-Modell basiert.

4 InvokeAI

Invoke AI ist ein weiteres KI-basiertes Bildgenerierungsmodell basierend auf Stable Diffusion, mit einer XL-Version basierend auf Stable Diffusion XL. Es verfügt außerdem über eine eigene Web- und Befehlszeilen-Benutzeroberfläche, sodass Sie sich nicht mit Dingen wie der Stable Diffusion-Web-Benutzeroberfläche herumschlagen müssen.

Das Modell konzentriert sich darauf, Benutzern die Möglichkeit zu geben, visuelle Darstellungen auf der Grundlage ihres geistigen Eigentums mit benutzerdefinierten Arbeitsabläufen zu erstellen. InvokeAI ist eines der besten Open-Source-KI-Bildgenerierungsmodelle zum Trainieren benutzerdefinierter Modelle und zum Arbeiten mit geistigem Eigentum.

Das offizielle Github-Repository listet zwei Installationsmethoden auf: die Installation über das Installationsprogramm von InvokeAI oder die Verwendung von PyPI, wenn Sie mit einem Terminal und Python vertraut sind und mehr Kontrolle über die mit dem Modell installierten Pakete benötigen.

Die zusätzliche Kontrolle bringt jedoch einige Einschränkungen mit sich, insbesondere strengere Hardwareanforderungen. InvokeAI empfiehlt eine dedizierte GPU mit mindestens 4 GB Speicher, wobei sechs bis acht GB für die Ausführung der XL-Variante empfohlen werden. Die VRAM-Anforderungen gelten sowohl für AMD- als auch für Nvidia-GPUs. Sie benötigen außerdem mindestens 12 GB RAM und 12 GB freien Speicherplatz für das Modell, seine Abhängigkeiten und Python.

Obwohl die Dokumentation die GPUs der GTX 10-Serie und 16-Serie von Nvidia aufgrund ihres fehlenden Videospeichers nicht empfiehlt, lief das bereitgestellte Installationsprogramm einwandfrei. Ihr Kilometerstand kann zwar variieren, aber wenn Sie eine GPU der unteren Preisklasse verwenden, müssen Sie damit rechnen, dass Sie länger warten müssen, bis Ihre Eingabeaufforderungen in Bilder umgewandelt werden. Schließlich können Sie unter Windows nur eine Nvidia-GPU verwenden, da AMD-GPUs derzeit nicht unterstützt werden.

Bei der Bilderzeugung tendiert das Modell eher zu künstlerischen Stilen als zum Fotorealismus. Natürlich können Sie das Modell anhand Ihres Datensatzes trainieren und Bilder erzeugen lassen, die Ihren Wünschen näher kommen, auch wenn es sich dabei um fotorealistische Bilder handelt, insbesondere wenn Sie in den Bereichen Produktdesign, Architektur oder Einzelhandelsflächen arbeiten. Beachten Sie jedoch, dass es sich bei InvokeAI in erster Linie um eine Bildgenerierungs-Engine handelt. Das bedeutet, dass Sie wahrscheinlich standardmäßig Ihre eigenen Modelle verwenden müssen, um die besten Ergebnisse zu erzielen (leicht zu finden über den Modellmanager in der Weboberfläche). Das Modell ist der stabilen Diffusion selbst ziemlich ähnlich.

5 Openjourney

Openjourney ist ein kostenloses Open-Source-KI-Bilderzeugungsmodell, das wiederum auf Stable Diffusion basiert. Wenn Sie sich fragen, warum das Modell Openjourney heißt, liegt das daran, dass es auf Midjourney-Bildern trainiert wurde und seinen Stil in den von ihm generierten Bildern nachahmen kann.

Mit PromptHero, dem Unternehmen hinter Openjourney, können Sie das Modell zusammen mit anderen Modellen testen, darunter Stable Diffusion (Versionen 1.5 und 2), DreamShaper und Realistic Vision. Wenn Sie sich anmelden, erhalten Sie 25 kostenlose Credits (ein Credit für jedes generierte Bild). Anschließend müssen Sie die Pro-Abonnementstufe abonnieren, die 9 US-Dollar pro Monat kostet und Ihnen jeden Monat Zugriff auf 300 Credits mit anderen exklusiven Funktionen bietet.

Wenn Sie es jedoch lokal und kostenlos ausführen möchten, können Sie die Modelldatei von HuggingFace herunterladen und über die Stable Diffusion-Web-Benutzeroberfläche ausführen. Openjourney ist außerdem das am zweithäufigsten heruntergeladene KI-Bildgenerierungsmodell auf HuggingFace, direkt hinter Stable Diffusion.

Openjourney listet auf seiner Website keine spezifischen Hardwareanforderungen für die lokale Ausführung des Modells auf, Sie können jedoch mit ähnlichen Hardwareanforderungen wie bei Stable Diffusion rechnen. Dies bedeutet eine dedizierte GPU mit 4 GB VRAM, 16 GB RAM und etwa 12 bis 15 GB freiem Speicherplatz auf Ihrem Computer, um das Modell und seine Abhängigkeiten zu speichern.

Von Openjourney generierte Bilder weisen in der Regel ein Gleichgewicht zwischen Fotorealismus und Kunst auf, sofern nicht anders angegeben. Wenn Sie auf der Suche nach einem Allround-Modell sind und das Erscheinungsbild von Midjourney bevorzugen, ohne für das Abonnement zu zahlen, ist Openjourney eine der besten Optionen.

Freigabeerklärung Dieser Artikel ist abgedruckt unter: https://www.makeuseof.com/best-open-source-ai-image-generators/ Bei Verstößen wenden Sie sich bitte an [email protected], um ihn zu löschen

Neuestes Tutorial Mehr>

8 Wesentliche kostenlose und bezahlte API -Empfehlungen für LLM
die Kraft von LLMs nutzen: Ein Leitfaden zu APIs für Großsprachenmodelle In der heutigen dynamischen Geschäftslandschaft revolutionieren APIs (Anwe...

KI Gepostet am 2025-04-21
Benutzerhandbuch: Falcon 3-7B-Anweisungsmodell
tii's Falcon 3: Ein revolutionärer Sprung in Open-Source Ai tiis ehrgeiziges Streben nach neu definierender KI erreicht neue Höhen mit dem Adva...

KI Gepostet am 2025-04-20
Deepseek-V3 gegen GPT-4O und Lama 3.3 70b: Das stärkste KI-Modell enthüllt
The evolution of AI language models has set new standards, especially in the coding and programming landscape. Leading the c...

KI Gepostet am 2025-04-18
Top 5 KI -intelligente Budgeting -Tools
Finanzielle Freiheit mit KI freischalten: Top -Budgeting -Apps in Indien Sind Sie es satt, uns ständig zu fragen, wohin Ihr Geld geht? Scheinen Re...

KI Gepostet am 2025-04-17
Detaillierte Erläuterung der Excel -Summenproduktfunktion - School of Data Analysis
Excels Sumproduktfunktion: Eine Datenanalyse Powerhouse Entsperren Sie die Kraft der Summenproduktfunktion von Excels für die optimierte Datenanaly...

KI Gepostet am 2025-04-16
Eingehende Forschung ist vollständig geöffnet, Chatgpt plus Benutzervorteile
OpenAs tiefe Forschung: Ein Game-Changer für AI Research OpenAI hat Deep Forschung für alle Chatgpt Plus -Abonnenten ausgelöst und verspricht einen...

KI Gepostet am 2025-04-16
Amazon Nova heute echte Erfahrung und Überprüfung - Analytics Vidhya
Amazon enthüllt Nova: Spitzended Foundation-Modelle für verbesserte KI und Inhaltserstellung Amazons jüngster Re: Erfindungs -Ereignis 2024 präse...

KI Gepostet am 2025-04-16
5 Möglichkeiten zur Verwendung von ChatGPT -Timing -Aufgabenfunktion
CHATGPTS neue geplante Aufgaben: Automatisieren Sie Ihren Tag mit ai chatgpt hat kürzlich eine bahnbrechende Funktion vorgestellt: geplante Aufgabe...

KI Gepostet am 2025-04-16
Welche der drei AI -Chatbots reagieren auf dieselbe Eingabeaufforderung am besten?
mit Optionen wie Claude, Chatgpt und Gemini können sich ein Chatbot auswählen, das sich überwältigend fühlen kann. Um das Geräusch zu durchschneid...

KI Gepostet am 2025-04-15
Chatgpt ist genug, es wird kein dedizierter KI -Chat -Computer benötigt
In einer Welt mit neuen KI -Chatbots, die täglich starten, kann es überwältigend sein, zu entscheiden, welches das richtige „eins“ ist. Aber meiner E...

KI Gepostet am 2025-04-14
Indischer KI -Moment: Wettbewerb mit China und den Vereinigten Staaten in Generativen KI
Indiens KI -Ambitionen: A 2025 Update Mit China und den USA, die stark in generative KI investieren, beschleunigt Indien seine eigenen Genai -Initi...

KI Gepostet am 2025-04-13
Automatisierung des Imports von CSV in PostgreSQL mit AirFlow und Docker
Dieses Tutorial zeigt, dass das Erstellen einer robusten Datenpipeline mit Apache Airstrow, Docker und PostgreSQL erstellt wird, um die Datenübertrag...

KI Gepostet am 2025-04-12
Swarm Intelligence Algorithmen: Drei Python -Implementierungen
Imagine watching a flock of birds in flight. There's no leader, no one giving directions, yet they swoop and glide together in perfect harmony. It may...

KI Gepostet am 2025-03-24
So machen Sie Ihre LLM mit Rag & Fine-Tuning genauer
Imagine studying a module at university for a semester. At the end, after an intensive learning phase, you take an exam – and you can recall th...

KI Gepostet am 2025-03-24
Was ist Google Gemini? Alles, was Sie über den Chatgpt -Rivalen von Google wissen müssen
Google recently released its new Generative AI model, Gemini. It results from a collaborative effort by a range of teams at Google, including members ...

KI Gepostet am 2025-03-23

Einstufung Mehr>

Japanisch lernen Koreanisch lernen Chinesisch lernen Fremdsprache lernen Spiel Häufiges Problem Technologie-Peripheriegeräte KI Software-Tutorial Programmierung Artikel