adesso Blog

Methodik

3. Juli 2023 von Kevin Pahlke

Stable Diffusion - Eine Einführung

Stable Diffusion AI ist eine aufregende Methode des maschinellen Lernens, die zur Generierung von hochwertigen Bildern verwendet wird. Basierend auf der Idee, dass ein neuronales Netzwerk eine Verteilung von Bildern lernen kann, indem es schrittweise Rauschen zu einem Bild hinzufügt, wird der Prozess der Bildgenerierung durch die Verwendung einer sogenannten Diffusionsgleichung gesteuert, die das Rauschen schrittweise reduziert, bis das endgültige Bild erreicht ist.

Prompts spielen eine entscheidende Rolle in diesem Prozess, indem sie dem Netzwerk eine Vorstellung davon geben, was es generieren soll. Prompts sind in der Regel kurze Sätze oder Bilder, die als Eingabe für das neuronale Netzwerk dienen. Sie helfen dem Netzwerk dabei, eine genaue Verteilung von Bildern zu erlernen, indem sie ihm ein Ziel vorgeben, das es erreichen soll.

In diesem Blog-Beitrag befasse ich mich mit der Erstellung von Prompts für Stable Diffusion AI. Ich werde die Grundlagen der Prompt-Erstellung erklären, Tipps zur Erstellung effektiver Prompts geben und häufige Fehler bei der Prompt-Erstellung aufdecken.

Durch die Verwendung von effektiven Prompts können die Ergebnisse von Stable Diffusion AI verbessert werden, indem sie dem Netzwerk helfen, genauere und qualitativ hochwertige Bilder zu generieren.

Bilder, die durch Stable Diffusion AI erstellt werden, sind eine vollständige Open Source und ausdrücklich in der CC0 1.0 Universal Public Domain Dedication enthalten. Durch die Anwendung der CC0-Lizenz können Urheberinnen und Urheber ihre Werke der Öffentlichkeit kostenlos zur Verfügung stellen, ohne dass Dritte ihre Nutzung, Veränderung oder Verbreitung einschränken oder verbieten können.

Wie werden grundlegend Prompts erstellt?

Einfache Eingabeaufforderungen können bereits zu guten Ergebnissen führen, aber manchmal sind es die Details, die ein Bild glaubwürdig machen. Auch die Sprache, in der der Prompt erstellt wird, kann sich auf das Ergebnis des Bildes auswirken. Es gibt viel zu lernen, um einen guten Prompt zu erstellen. Aber das Wichtigste ist, das Thema so detailliert wie möglich zu beschreiben. Es sollte sichergestellt werden, dass leistungsstarke Schlüsselwörter verwenden werden, um den Stil zu definieren.

Ein guter Stable Diffusion Prompt sollte so spezifisch wie möglich sein. Es ist sinnvoll, spezifische Prompts zu verwenden, die den Inhalt des gewünschten Bildes vollständig beschreiben. Es ist auch hilfreich, spezifische Kunststile oder -medien zu nennen. Der Stable-Diffusion-Algorithmus kann auch durch das Nennen bestimmter Künstlerinnen oder Künstler geleitet werden.

Das Gewichten von Schlüsselwörtern ist ein wichtiger Schritt bei der Erstellung eines Stable Diffusion Prompts. Das wichtigste Schlagwort sollte zuerst genannt werden, danach können die weniger wichtigen Schlagwörter aufgezählt werden. Es können auch Synonyme verwendet werden, um Schlüsselwörter zu gewichten. Wenn beispielsweise ein Bild eines Hundes erstellt werden soll, kann man den Begriff Hund als wichtigstes Schlüsselwort verwenden und dann Synonyme hinzufügen – beispielsweise Welpe, Haustier oder Vierbeiner. Am Anfang ist es wichtig, eine Reihe von Schlüsselwörtern und ihre beabsichtigte Wirkung zu lernen. Dies ist vergleichbar mit dem Erlernen von Vokabeln in einer neuen Sprache.

Eine Möglichkeit, qualitativ hochwertige Bilder zu erstellen, ist die Wiederverwendung vorhandener Prompts. Es gibt viele Sammlungen von Prompts, die einfach kopiert und ausprobiert werden können. Vorhandene Prompts können als Ausgangspunkt genutzt und auf die jeweiligen Bedürfnisse abgestimmt werden. Die folgenden Bespiele verdeutlichen dies:

Ein einfach beschriebener Beispiel-Prompt: very cute kid's film character

Ein detailiert beschriebener Beispiel-Prompt: anthro, very cute kid's film character, disney pixar zootopia character concept artwork, 3d concept, detailed fur, high detail iconic character for upcoming film, trending on artstation, character design, 3d artistic render, highly detailed, octane, blender, cartoon, shadows, lighting

Der Unterschied zwischen den beiden Aufforderungen ist offensichtlich. Im ersten Beispiel kann etwas als Ergebnis herauskommen, was vielleicht nicht gewollt war. Beim zweiten Beispiel ist das Ergebnis schon näher an dem, was man erwartet hat. Zur Verfeinerung des Ergebnisses und zur Erzeugung atemberaubender Bilder kann die zweite Aufforderung jedoch noch verbessert werden.

Beispiele für die Prompts

Der folgende Abschnitt gibt einen Überblick über die Art von Bildern, die mit Stable Diffusion AI erstellt werden können. Die folgenden Bilder wurden mit der kostenlosen Online-Version von Stable Diffusion AI erstellt.

Tier

wildlife photography, fox looking at you, photograph, high quality, wildlife, f 1.8, soft focus, 8k, national geographic, award - winning photograph by nick Nichols

Architekturvisualisierung

loft, home, steel, stone, interior, octane render, deviantart, cinematic, key art, hyperrealism, sun light, sunrays, 35 mm, 8k, medium - format print

Gebäude

house, small hill, old trees, smal lake, 35 mm, realism, octane render, 8k, trending on artstation, unreal engine, hyper detailed, photo - realistic maximum detail, volumetric light, realistic matte painting, hyper photorealistic, trending on artstation, ultra - detailed, realistic

Cartoon Charakter

anthro, very cute kid's film character alien, disney pixar zootopia character concept artwork, 3d concept, detailed fur, high detail iconic character for upcoming film, trending on artstation, character design, 3d artistic render, highly detailed, octane, blender, cartoon, shadows, lighting

Fotografie Closeup

close up of a grilled steak, depth of field. bokeh. soft light. by Yasmin Albatoul, Harry Fayt. centered. extremely detailed. Nikon D850, (35mm|50mm|85mm). award winning photography

Fotografie Portrait

Portrait of grandmother, photograph, highly detailed face, depth of field, moody light, golden hour, style by Dan Winters, Russell James, Steve McCurry, centered, extremely detailed, Nikon D850, award winning photography

Tipps und Tricks für die Prompt-Erstellung

Man kann folgende Settings für Stable Diffusion in die Prompts einbauen, um die Qualität des Bildes zu verbessern:

CFG-Scale

Der Classifier Guidance Scale ist ein Parameter, der frei steuert, wie stark das Modell der gegebenen Aufforderung folgen soll.

1 – Die Aufforderung wird weitgehend ignoriert.
3 – Das Modell geht etwas kreativer mit der Aufforderung um.
7 – Es besteht ein gutes Gleichgewicht zwischen der Einhaltung der Aufforderung und der Freiheit, kreativ zu sein.
15 – Das Modell hält sich mehr an die Aufforderung.
30 – Die Aufforderung wird streng befolgt.

Sampling-Steps

Die Qualität verbessert sich, wenn die Anzahl der Abtastschritte erhöht wird. In der Regel reichen 20 Schritte mit dem Euler-Sampler aus, um ein hochwertiges, scharfes Bild zu erzeugen. Obwohl sich das Bild bei höheren Abtastwerten noch subtil verändert, wird es sich verändern, aber nicht unbedingt eine höhere Qualität erreichen.

Meine Empfehlung: 20 Schritte. Erhöhen Sie die Anzahl der Schritte, wenn Sie die Qualität als zu gering erachten.

Sampling-Methoden

Hierbei handelt es sich einfach um verschiedene Methoden zur Lösung von Diffusionsgleichungen. Folgende Methoden können in den Prompt eingebaut werden: Euler a, Euler, LMS, Heun, DP2M, DP2M a, DPM fast, LMS Karras, DPM2 Karass, DDIM, PLMS etc.Es gibt verschiedene Diskussionen darüber, welche Methode für welchen Stil geeignet ist. Die Empfehlung an dieser Stelle ist „Learning by Doing“ – einfach verschiedene Methoden ausprobieren.

Meine Empfehlung: Euler

Bildgröße

Da Stable Diffusion AI mit 512 × 512 Bildern trainiert ist, können bei der Verwendung von Hoch- oder Querformatgrößen unerwartete Probleme auftreten. Wenn möglich, sollte immer ein quadratisches Format verwendet werden.

Meine Empfehlung: Setzt die Bildgröße auf 512 × 512.

Batch-Größe

Die Batch-Größe gibt an, wie viele Bilder pro Vorgang generiert werden. Da das Endergebnis sehr stark vom Zufallsfaktor abhängt, ist es immer eine gute Idee, mehrere Bilder gleichzeitig zu generieren. Auf diese Weise bekommt man ein gutes Gefühl dafür, was mit der aktuellen Aufforderung möglich ist.

Meine Empfehlung: Setzt die Batch-Größe auf 4 oder 8.

So kann ein entsprechender Prompt aussehen: batch-szise: 4, Steps: 20, Sampler: Euler a, CFG scale: 7, ultra realistic alien-trooper, concept art, intricate details, highly detailed, photorealistic, octane render, 8k, unreal engine, sharp focus, volumetric lighting unreal engine. art by artgerm and alphonse mucha

Das Ergebnis kann sich sehen lassen:

Mit Stable Diffusion AI können atemberaubende Bilder kostenlos und lizenenfrei erstellt werden. Mit etwas Übung lassen sich so fantastische Ergebnisse erzielen.

Weitere spannende Themen aus der adesso-Welt findet ihr in unseren bisher erschienenen Blog-Beiträgen.

Auch interessant:

KI und Kreativität - Quo Vadis

Autor Kevin Pahlke

Kevin Pahlke ist Consultant bei adesso.

Kategorie:	Methodik
Schlagwörter:	Kreativität Künstliche Kreativität

Unsere Blog-Beiträge im Überblick

In unserem Tech-Blog nehmen wir Sie mit auf eine spannende Reise durch die adesso-Welt. Weitere interessante Themen finden Sie in unseren bisherigen Blog-Beiträgen.

Zu allen Blog-Beiträgen

Unser Newsletter zum adesso Blog

Sie möchten regelmäßig unser adesso Blogging Update erhalten? Dann abonnieren Sie doch einfach unseren Newsletter und Sie erhalten die aktuellsten Beiträge unseres Tech-Blogs bequem per E-Mail.

Jetzt anmelden