Starten wir einmal mit DALL-E, dem Text-to-Image-Modell von ChatGPT, das auch von Microsoft Copilot verwendet wird. DALL-E bietet derzeit drei verschiedene Bildformate. Mit diesen Prompts kannst Du DALL-E anweisen, Bilder in bestimmten Formaten zu erzeugen.

Quadratisch

Bildformate in DALL-E

Wenn Du keine näheren Angaben machst, wird das Bild quadratisch erstellt und hat die Abmessungen 1.024 × 1.024 Pixel (also insgesamt 1 Megapixel). Sollte das Ergebnis – warum auch immer – in einem anderen Format ausgegeben worden sein, kannst Du den Prompt „square format“ verwenden.

Hochformat

Bildformate in DALL-E

Hochformatige Bilder haben das Seitenverhältnis 4:7 bzw. eine Auflösung von 1.024 × 1.792 Pixel, somit ca. 1,8 Megapixel. Um Bilder im Hochformat zu generieren, verwendest Du am besten „portrait format“.

Querformat

Bildformate in DALL-E

Querformatige Bilder haben entsprechend das Seitenverhältnis 7:4 bzw. eine Auflösung von 1.792 × 1.024 Pixel, somit ebenfalls ca. 1,8 Megapixel. Querformat wird im Englischen normalerweise als „landscape format“ bezeichnet, allerdings kann es bei diesem Prompt passieren, dass DALL-E nicht das Querformat verwendet, sondern eine Landschaft (engl. landscape) erstellt. Mit „wide format“ bist Du auf der sicheren Seite.

Andere Text-to-Image-Modelle:

Midjourney

Quadratisch: 1.024 × 1.024
Querformat: 1.232 × 928 (77:58)
Hochformat: 928 × 1.232 (58:77)

Mistral

Quadratisch: 1.024 × 1.024
Querformat: 1.024 × 768 (4:3)
Hochformat: 768 × 1.024 (3:4)

Imagen 3 (Gemini)

Quadratisch: 2.048 × 2.048

Flux

Quadratisch: 1.024 × 1.024
Querformat: 1.344 × 768 (16:9), 1.152 × 896 (4:3), 1.216 × 832 (3:2), 1.216 × 768 (8:5), 1.472 × 704 (19:9), 1.536 × 640 (21:9)
Hochformat: 640 × 1.536 (9:21), 704 × 1.472 (9:19), 768 × 1.216 (5:8), 832 × 1.216 (2:3), 896 × 1.152 (3:4) 768 × 1.344 (9:16)

Stable Diffusion XL

Quadratisch: 1.024 × 1.024
Quer- und Hochformat: verschiedene Seitenverhältnisse sind möglich. Sowohl Breite als auch Höhe müssen dabei aber durch 64 teilbar und größer als 384 sein. Die Gesamtpixelanzahl (also Länge × Breite) darf max. 1.048.576 betragen.