Un prompt pour visualiser le vocabulaire en contexte

Introduction

Créer des supports visuels efficaces pour enseigner du vocabulaire (en langue étrangère notamment) n’est pas si simple. Trop souvent, les images sont ambiguës, surchargées ou mal adaptées à l’objectif pédagogique.

Et pourtant, une bonne image peut accélérer la mémorisation, clarifier un sens et ancrer une structure linguistique.

Dans le cadre d’une formation à l’intelligence artificielle pour enseignants de français, FLE, alphabétisation et langues une collègue prof de néerlandais (Elke, merci à toi) m’a partagé une idée particulièrement pertinente :
👉 utiliser un prompt structuré pour générer des images pédagogiques claires, cohérentes et mémorisables.

Je vous propose ici un prompt prêt à l’emploi pour réaliser ce genre de visuels.

Description du prompt

Ce prompt permet de générer automatiquement des images qui :

  • illustrent plusieurs mots, verbes ou expressions en contexte ;
  • restent claires, sans ambiguïté ;
  • utilisent une seule scène continue ;
  • s’adaptent à ton objectif pédagogique ;
  • fonctionnent avec la plupart des outils d’IA générative.

Il est donc idéal pour :

  • travailler le vocabulaire et les expressions français, FLE, alphabétisation et en langues ;
  • réviser des verbes d’action ;
  • créer des supports pour l’expression orale.

Ce prompt repose sur plusieurs principes pédagogiques solides :

  1. Une seule scène continue (pas de collage, pas de cases ni tryptique) pour une compréhension globale plus naturelle.
  2. Un personnage = une action – Chaque élément est clairement identifiable grâce à un geste, une posture, un objet, … Ce qui réduit fortement les confusions (très utile en alphabétisation et FLE débutant notamment).
  3. Simplicité visuelle – Le prompt impose une palette limitée, un fond non chargé et une lumière claireafin de favoriser la lisibilité et dès lors la mémorisation.
  4. Des contraintes anti-erreurs intégrées – Le prompt inclut automatiquement l’exclusion de contenu problématique, des règles de qualité (mains, résolution, etc.) et l’interdiction des layouts complexes.

Objectif(s) du prompt

  • Structurer la description d’un visuel pédagogique afin de générer une image claire, cohérente et exploitable en classe ;
  • Traduire des mots, verbes ou expressions en représentations visuelles explicites, en réduisant les ambiguïtés d’interprétation ;
  • Appliquer des principes de didactique visuelle (simplicité, lisibilité, mémorisation) dans la génération d’images par IA ;
  • Organiser une scène unique et continue permettant d’illustrer plusieurs éléments linguistiques sans segmentation ni surcharge cognitive ;
  • Optimiser un prompt pour générateur d’images en intégrant des contraintes techniques (composition, lumière, style, negative prompts) ;
  • Adapter le visuel aux objectifs pédagogiques (compréhension, production orale, mémorisation, évaluation) ;

Résultat obtenu : un prompt structuré (au format CRISTAL*) générant une image pédagogique efficace, directement exploitable pour l’enseignement des langues.

*Retrouvez une explication du framework « CRISTAL » dans l’article d’Aurélia sur la Géneration de planches de BD et de mises en situations narratives ainsi que dans la vidéo Youtube de Ludo Salenne : Générer des images avec Nano Banana – Le tuto complet.

Quelques exemples

FLE – Reconnaître le mots courants liés à l’environnement quotidien

  • Mots à mettre en contexte : caddie, caisse, ticket, panier, légumes, fruits, pain, lait, fromage, bouteille, sac
  • Les mots ne sont pas affichés
  • Scène : supermaché
  • Style : photoréaliste
Prompt (format Markdown)
# Prompt pédagogique (C.R.I.S.T.A.L.) — Supermarché (photoréaliste, panoramique)

## Items à illustrer (sans ambiguïté)
caddie, caisse, ticket, panier, légumes, fruits, pain, lait, fromage, bouteille, promo, sac

---

## C — Contexte & Composition (ANTI-TRIPTYQUE DUR)
**Scène unique continue, prise unique non retouchée :** une seule scène continue dans un supermarché **animé**, à **une seule caisse** (checkout) avec tapis roulant, **un seul point de vue**, **un seul cadrage**, **une seule caméra**, **une seule perspective**, **sans montage**.  
**Continuité imposée :** arrière-plan continu, sol continu, éclairage continu (gradient naturel), aucune transition abrupte.  
**Composition chorale lisible :** avant-plan (tapis + articles), plan moyen (client(s) + caissier/caissière), arrière-plan (rayons flous mais continus). **Aucune segmentation** (pas de zones, pas de panneaux, pas de grilles).

## R — Rôle des sujets (multi-personnages, 1 action = 1 signature visuelle)
- **Client 1 (signature “caddie + sac”)** : pousse un **caddie** (chariot) bien visible ; un **sac** de courses réutilisable (tote) est posé dans/près du chariot, ouvert.
- **Client 2 (signature “panier”)** : tient un **panier** (hand basket) distinct du chariot, bien cadré et identifiable.
- **Caissier/caissière (signature “caisse + ticket”)** : derrière la **caisse** (registre) ; un **ticket** (reçu papier) est clairement visible, soit en train d’être tendu au client, soit posé sur le comptoir/tapis, **sans texte lisible**.

**Objets-signatures (clairs et non ambigus, tous visibles dans la même scène)**
- **légumes** : par ex. carottes + salade (formes évidentes) sur le tapis.
- **fruits** : par ex. pommes + bananes sur le tapis.
- **pain** : baguette ou miche identifiable sur le tapis.
- **lait** : brique ou bouteille de lait neutre, sans marque, sur le tapis.
- **fromage** : morceau de fromage (type wedge) emballage neutre, sur le tapis.
- **bouteille** : bouteille d’eau neutre (sans marque), sur le tapis.
- **promo** : une **étiquette promo** (tag jaune/rouge) accrochée au bord d’un rayon proche **sans aucun texte ni chiffres** (forme “starburst”/pastille).
- **sac** : sac réutilisable visible (tissu), distinct du panier.

## I — Intention stylistique
**Photoréaliste** : rendu caméra réaliste, matériaux crédibles, couleurs naturelles, pas d’illustration, pas de cartoon, pas de style mixte.

## S — Scénographie & lumière
**Ambiance :** supermarché animé, **après-midi**, **lumière naturelle** douce (complétée par éclairage plafond neutre), lisibilité maximale des mains/objets/tapis/registre.  
Expressions et poses neutres, pédagogiques, non dramatiques.

## T — Teintes & palette
Palette simple et réaliste : tons neutres (gris/blanc) + accents doux (verts/rouges des produits), fond discret, aucune surcharge visuelle.

## A — Apparence & détails (net, utile, mémorisable)
Haute netteté sur les objets clés (tapis + mains + panier + chariot + ticket).  
Profondeur de champ **légère et naturelle** : tout ce qui porte du sens reste lisible, arrière-plan légèrement flouté.  
Aucun élément parasite : pas d’affiches lisibles, pas d’emballages de marque, pas d’étiquettes avec texte.

## L — Limitations / Negative prompt (qualité + sécurité + anti-layout)
**Toujours exclure :** NSFW, nudity, sexualization, violence, gore, weapons, drugs, hate, harassment, illegal content, logos, brands, watermarks, unreadable text, spelling errors, extra fingers, deformed hands, low-res, blur, artifacts, noise, cluttered background.  
**Anti-triptyque/anti-montage renforcé (ajouter tel quel) :**  
“no collage, no split screen, no panels, no comic strip layout, no diptych, no triptych, no multi-panel, no three columns, no vertical bands, no side-by-side, no quadrants, no grid layout, no borders, no separators, no gutters, no frame-within-frame, no montage, no multiple scenes, no poster layout, no infographic layout”.  
**Texte interdit :** no text, no letters, no typography, no captions, no labels, no signs with readable writing, no numbers.

---

## PROMPT (à coller tel quel dans le générateur)
**Positive prompt :**  
Photorealistic panoramic supermarket checkout scene, single continuous scene, single unedited shot, one camera, one viewpoint, one uninterrupted composition, continuous background and ground plane, continuous natural lighting gradient. Busy supermarket in the afternoon with soft natural daylight and neutral ceiling lights. At a single checkout register (caisse) with conveyor belt: a cashier behind the register handing or placing a paper receipt (ticket) clearly visible but with no readable text. In the foreground on the conveyor belt, clearly separated and fully visible items: fresh vegetables (carrots and lettuce), fresh fruits (apples and bananas), a loaf/baguette of bread, a plain unbranded milk carton, a wedge of cheese in neutral packaging, a plain unbranded water bottle. Two customers in the same frame: one customer pushing a shopping cart (caddie) clearly visible with a reusable shopping bag (sac) open inside or beside it; another customer holding a hand basket (panier) clearly distinct from the cart. A blank promo tag (promo) in bright yellow/red starburst shape attached to a nearby shelf edge with no text or numbers. Clean educational clarity, no clutter, hands and objects clearly readable, high detail where useful, realistic materials, natural colors, slight natural depth of field.

**Negative prompt :**  
NSFW, nudity, sexualization, violence, gore, weapons, drugs, hate, harassment, illegal content, logos, brands, watermarks, unreadable text, spelling errors, extra fingers, deformed hands, low-res, blur, artifacts, noise, cluttered background,  
“no collage, no split screen, no panels, no comic strip layout, no diptych, no triptych, no multi-panel, no three columns, no vertical bands, no side-by-side, no quadrants, no grid layout, no borders, no separators, no gutters, no frame-within-frame, no montage, no multiple scenes, no poster layout, no infographic layout”,  
no text, no letters, no typography, no captions, no labels, no numbers, no readable signage.

---

## Paramètres techniques (par défaut optimisés)
- **aspect_ratio** : 16:9 (panoramique)
- **resolution** : 4K
- **quality** : high
- **depth_of_field** : slight, natural (everything meaningful readable)
- **photorealism** : true
- **camera** : eye-level, 35–50mm equivalent, single shot
Prompt (format XML)
<promptPackage>
  <prompt>
    Photorealistic panoramic supermarket checkout scene, single continuous scene, single unedited shot, one camera, one viewpoint, one uninterrupted composition, continuous background and ground plane, continuous natural lighting gradient. Busy supermarket in the afternoon with soft natural daylight and neutral ceiling lights. At a single checkout register (caisse) with conveyor belt: a cashier behind the register handing or placing a paper receipt (ticket) clearly visible but with no readable text. In the foreground on the conveyor belt, clearly separated and fully visible items: fresh vegetables (carrots and lettuce), fresh fruits (apples and bananas), a loaf/baguette of bread, a plain unbranded milk carton, a wedge of cheese in neutral packaging, a plain unbranded water bottle. Two customers in the same frame: one customer pushing a shopping cart (caddie) clearly visible with a reusable shopping bag (sac) open inside or beside it; another customer holding a hand basket (panier) clearly distinct from the cart. A blank promo tag (promo) in bright yellow/red starburst shape attached to a nearby shelf edge with no text or numbers. Clean educational clarity, no clutter, hands and objects clearly readable, high detail where useful, realistic materials, natural colors, slight natural depth of field.
  </prompt>

  <negativePrompt>
    NSFW, nudity, sexualization, violence, gore, weapons, drugs, hate, harassment, illegal content, logos, brands, watermarks, unreadable text, spelling errors, extra fingers, deformed hands, low-res, blur, artifacts, noise, cluttered background,
    “no collage, no split screen, no panels, no comic strip layout, no diptych, no triptych, no multi-panel, no three columns, no vertical bands, no side-by-side, no quadrants, no grid layout, no borders, no separators, no gutters, no frame-within-frame, no montage, no multiple scenes, no poster layout, no infographic layout”,
    no text, no letters, no typography, no captions, no labels, no numbers, no readable signage
  </negativePrompt>

  <parameters>
    <aspect_ratio>16:9</aspect_ratio>
    <resolution>4K</resolution>
    <quality>high</quality>
    <depth_of_field>slight_natural</depth_of_field>
    <photorealism>true</photorealism>
    <camera>single_shot_eye_level_35-50mm</camera>
  </parameters>

  <variants>
    <variant id="noText">
      <notes>Texte interdit : aucune typographie, aucun panneau lisible, aucune étiquette avec lettres/chiffres.</notes>
    </variant>
  </variants>
</promptPackage>
Image générée avec Google Gemini (Nano Banana2)

Langues – Illustrer des actions

  • Mots à mettre en contexte : rennen langs het strand, zwemmen in de zee, zonnen, volleybal spelen
  • Les mots sont affichés
  • Scène : plage
  • Style : cartoon
Prompt (format Markdown)
# CRISTAL Prompt — Image pédagogique (langue NL)

## C — Contexte & Composition (ANTI-TRIPTYQUE DUR)
Single continuous scene, single unedited shot, one camera, one viewpoint, one uninterrupted composition; continuous beach background, continuous sand and shoreline, continuous lighting gradient from sky to sea, no abrupt transitions. A lively beach setting with multiple characters naturally distributed in depth (foreground, midground, background) without any segmentation. Characters are positioned organically along the shore so all actions are visible at a glance, with clear spatial separation to avoid gesture ambiguity.

## R — Rôle du/des sujets
Four distinct characters (one per action), each with a clear visual signature:
1) Running along the beach: athletic character jogging parallel to the shoreline, footprints in sand, arm swing and forward lean.
2) Swimming in the sea: character in water with visible stroke motion and small splashes, head above water.
3) Sunbathing: character lying on a towel, relaxed posture, sunglasses, sun hat.
4) Playing volleyball: character jumping or mid-play hitting a ball near a visible net (net can be partially in frame), dynamic arm gesture.
No overlapping gestures; each action is immediately recognizable via pose + object + environment cue.

## I — Intention stylistique
Cartoon style, clean outlines, simplified but expressive characters, consistent visual language, bright and friendly look suitable for language learning; no mixing with other styles.

## S — Scénographie & lumière
Sunny morning light, soft warm sunlight, gentle shadows, high visibility of hands, faces, and props. Sea lightly animated, sky clear with a few soft clouds. Pedagogical clarity prioritized over drama.

## T — Teintes & palette
Dominant colors: sky blue, sand beige, sea turquoise; accents: bright primary colors for clothing and props. Background remains simple and uncluttered.

## A — Apparence & détails
High sharpness; details only where helpful (faces, hands, ball, towel, water splashes). Avoid visual noise. 
**Text = OUI (NL)**:
- One single global caption box at the bottom with all items in Dutch, sans-serif, highly legible.
- Optional non-segmenting numbering: small, discreet numbers (1–4) on clothing/objects with a matching legend in the caption box.
- Caption content (NL): “rennen langs het strand, zwemmen in de zee, zonnen, volleybal spelen”.
- Also include a **variant without text** (same scene, no caption or numbers).

## L — Limitations / Negative prompts
NSFW, nudity, sexualization, violence, gore, weapons, drugs, hate, harassment, illegal content, logos, brands, watermarks, unreadable text, spelling errors, extra fingers, deformed hands, low-res, blur, artifacts, noise, cluttered background. 
**Anti-layout**: no collage, no split screen, no panels, no comic strip layout, no diptych, no triptych, no multi-panel, no three columns, no vertical bands, no side-by-side, no quadrants, no grid layout, no borders, no separators, no gutters, no frame-within-frame, no montage, no multiple scenes, no poster layout, no infographic layout.

## Paramètres techniques
- aspect_ratio: 4:3  
- resolution: 4K  
- quality: high  
- depth_of_field: slight, natural (everything readable)  
- photorealism: off (cartoon)
Prompt (format XML)
<prompt>
  <context>
    Single continuous beach scene, one camera/viewpoint, uninterrupted composition; continuous sand, shoreline, and lighting gradient. Lively morning beach with multiple characters distributed in depth (foreground/midground/background), no segmentation.
  </context>
  <roles>
    Four characters, one per action with clear visual signatures: running along the beach (footprints, jogging posture), swimming in the sea (stroke motion, splashes), sunbathing (lying on towel, sunglasses/hat), playing volleyball (dynamic hit near a net). No gesture overlap.
  </roles>
  <intent>
    Cartoon style, clean outlines, bright friendly colors, consistent and didactic.
  </intent>
  <scene>
    Sunny morning, soft warm light, gentle shadows, clear sky with a few clouds, lightly animated sea; high visibility of hands, faces, and props.
  </scene>
  <tones>
    Palette: sky blue, sand beige, sea turquoise; accents with bright clothing/props; simple unobtrusive background.
  </tones>
  <appearance>
    High sharpness, useful details only. Bottom caption box with Dutch text in sans-serif: "rennen langs het strand, zwemmen in de zee, zonnen, volleybal spelen"; optional small numbers (1–4) on subjects with matching legend. Provide variant without text.
  </appearance>
  <limitations>
    NSFW, nudity, sexualization, violence, gore, weapons, drugs, hate, harassment, illegal content, logos, brands, watermarks, unreadable text, spelling errors, extra fingers, deformed hands, low-res, blur, artifacts, noise, cluttered background. no collage, no split screen, no panels, no comic strip layout, no diptych, no triptych, no multi-panel, no three columns, no vertical bands, no side-by-side, no quadrants, no grid layout, no borders, no separators, no gutters, no frame-within-frame, no montage, no multiple scenes, no poster layout, no infographic layout.
  </limitations>
  <technical>
    <aspect_ratio>4:3</aspect_ratio>
    <resolution>4K</resolution>
    <quality>high</quality>
    <depth_of_field>slight_natural</depth_of_field>
    <photorealism>false</photorealism>
  </technical>
  <variants>
    <withText>true</withText>
    <noText>true</noText>
  </variants>
</prompt>
Image générée avec Google Gemini (Nano Banana2)

Illustrer les notions de position

  • Mots à mettre en contexte : dessus, dessous, à gauche, à droite
  • Les mots ne sont pas affichés
  • Scène : rue
  • Style : pixar
Prompt (format Markdown)
# CRISTAL Prompt — Apprentissage spatial (Dessus, Dessous, À gauche, À droite)

## C — Contexte & Composition
Single continuous scene, single unedited shot, one camera, one viewpoint, one uninterrupted composition.  
Street scene in the afternoon with bright, clear sunlight; continuous background of a simple urban sidewalk with a few storefronts, a bench, a lamppost, and a tree; continuous ground plane and smooth lighting gradient with no abrupt transitions.  
Choral staging with multiple characters arranged naturally along the same sidewalk space; foreground, midground, and background used for clarity without segmentation. No panels, no splits, no zones. Everything belongs to one cohesive moment.

## R — Rôle du/des sujets
Multiple characters (ideally 4), each clearly demonstrating one spatial relation with a distinct visual signature:
- **Dessus (above/on top)**: character standing on top of a sturdy bench, upright posture, looking down slightly.
- **Dessous (under/below)**: character crouching under the same bench, visible head and hands emphasizing “under”.
- **À gauche (to the left)**: character positioned clearly to the left side of a central object (e.g., a lamppost), body turned slightly toward it.
- **À droite (to the right)**: character positioned clearly to the right side of the same central object, symmetrical clarity.

Each action is unambiguous via gesture + object + position; no overlap or occlusion that could confuse interpretation.

## I — Intention stylistique
Pixar-inspired 3D animation style: soft, expressive characters, slightly stylized proportions, warm and friendly mood, high-quality rendering, cohesive materials and shading typical of animated feature films.

## S — Scénographie & lumière
Bright afternoon lighting with soft shadows; even illumination across all characters to ensure readability of positions and gestures.  
Clean street design: simple props (bench, lamppost, tree) to anchor spatial relationships pedagogically.

## T — Teintes & palette
Limited palette: warm sunlight tones (golden/yellow highlights), soft pastel building colors, neutral sidewalk grays. Characters use distinct but harmonious colors to separate roles without clutter.

## A — Apparence & détails
High sharpness, clean edges, detailed but not busy. Emphasis on clarity of positions, body orientation, and interaction with objects. No unnecessary background complexity.  
No text elements of any kind.

## L — Limitations / Negative prompts
NSFW, nudity, sexualization, violence, gore, weapons, drugs, hate, harassment, illegal content, logos, brands, watermarks, unreadable text, spelling errors, extra fingers, deformed hands, low-res, blur, artifacts, noise, cluttered background.  
no collage, no split screen, no panels, no comic strip layout, no diptych, no triptych, no multi-panel, no three columns, no vertical bands, no side-by-side, no quadrants, no grid layout, no borders, no separators, no gutters, no frame-within-frame, no montage, no multiple scenes, no poster layout, no infographic layout  
no text, no letters, no typography, no captions, no labels

## Paramètres techniques
- aspect_ratio: 4:3  
- resolution: 4K  
- quality: high  
- depth_of_field: slight, natural, everything clearly readable  
- photorealism: no (Pixar-style rendering)
Prompt (format XML)
<prompt>
  <context>
    Single continuous street scene in the afternoon with bright clear light, one unedited shot, one camera, continuous background and ground plane, cohesive sidewalk setting with simple props like a bench, a lamppost, and a tree.
  </context>
  <roles>
    Multiple characters each illustrating one spatial concept: one standing on top of a bench (dessus), one crouching under the bench (dessous), one clearly positioned to the left of a lamppost (à gauche), one clearly positioned to the right of the same lamppost (à droite), all gestures and positions unambiguous.
  </roles>
  <style>Pixar-style 3D animation, soft expressive characters, high-quality rendering, warm and friendly mood</style>
  <scenography>
    Bright afternoon lighting, soft shadows, evenly lit characters, minimal clean urban background for educational clarity.
  </scenography>
  <palette>
    Warm sunlight tones, pastel buildings, neutral grays, harmonious character colors.
  </palette>
  <appearance>
    High sharpness, clear silhouettes, simple readable details, no clutter.
  </appearance>
  <text>noText</text>
  <negative>
    NSFW, nudity, sexualization, violence, gore, weapons, drugs, hate, harassment, illegal content, logos, brands, watermarks, unreadable text, spelling errors, extra fingers, deformed hands, low-res, blur, artifacts, noise, cluttered background, no collage, no split screen, no panels, no comic strip layout, no diptych, no triptych, no multi-panel, no three columns, no vertical bands, no side-by-side, no quadrants, no grid layout, no borders, no separators, no gutters, no frame-within-frame, no montage, no multiple scenes, no poster layout, no infographic layout, no text, no letters, no typography, no captions, no labels
  </negative>
</prompt>
Image générée avec Chat GPT (version gratuite)

Prompt à récupérer

Formulaire Interactif

Tu es un assistant expert en création de prompts d’images pédagogiques pour l’apprentissage des langues. Tu maîtrises l’ingénierie de prompt C.R.I.S.T.A.L., la didactique visuelle (clarté, univoque, mémorisation), la génération de contextes/ambiances, l’optimisation technique (composition, lumière, cohérence), et la rédaction de negative prompts robustes (qualité + sécurité + anti-segmentation). Mon contexte est je prépare des supports visuels pour des cours de langue et je veux des images mémorisables, sans ambiguïté, illustrant clairement des mots/verbes/expressions. Mon objectif est obtenir un prompt d’image complet au format C.R.I.S.T.A.L., optimisé pour un générateur d’images, avec une version Markdown + une version XML générique, après une interaction guidée, sans questions superflues. Tu vas mener une interaction strictement séquentielle en 4 questions (Q1→Q4), une seule question par message, en attendant la réponse à chaque question, puis générer le livrable final en deux blocs code copiables (Markdown + XML). Pour ça, voici les étapes à suivre : Règles conversationnelles STRICTES (anti-saut d’étape)

Tu poses une seule question par message. Tu n’avances jamais à l’étape suivante tant que l’utilisateur n’a pas répondu à la question en cours. Tu ne génères jamais le livrable final tant que Q4 (Style) n’a pas reçu de réponse. Tu n’infères pas le style : tu DOIS poser Q4. Si l’utilisateur répond à plusieurs questions en une seule fois, tu “consommes” les infos disponibles et tu poses uniquement la prochaine question manquante, sans reposer le reste.

Q1 — Items (OBLIGATOIRE) Pose exactement cette question, et STOP après l’avoir posée : Q1. “Quels mots / verbes d’action / expressions veux-tu voir dans l’image ? ➡️ Donne une liste (séparée par des virgules).” Analyse interne après la réponse (ne pas afficher) :

Extraire tous les items (ne rien ignorer). Classer : action/mouvement, interaction, routine, objet, émotion, direction, expression. Préparer une représentation en une seule scène continue avec plusieurs personnages si nécessaire (idéal : 1 personnage par action), sans segmentation ni panneaux. Préparer des indices visuels “signature” pour chaque item (geste + objet + posture/équipement).

Q2 — Texte dans l’image ? (OBLIGATOIRE) Après la réponse à Q1, poser exactement cette question, et STOP : Q2. “➡️ Souhaites-tu que ces mots apparaissent écrits dans l’image (OUI/NON) ? Si OUI, indique aussi la langue cible dans la même réponse (ex : OUI – EN / OUI – FR / OUI – NL).” Analyse interne après la réponse (ne pas afficher) :

Si texte = OUI : enregistrer la langue. Si texte = NON : aucune langue requise ; ajouter des interdictions “no text/typography”. Important anti-triptyque : si texte = OUI, prévoir un seul cartouche global (bas de l’image) plutôt que des étiquettes/boîtes flottantes par action.

Q3 — Ambiance (OBLIGATOIRE) Après Q2, poser exactement cette question, et STOP : Q3. “Quelle ambiance veux-tu pour l’image ? (décris en une phrase : lieu + moment + lumière).” Analyse interne après la réponse (ne pas afficher) :

Traduire l’ambiance en contraintes visuelles (décor simple, lumière pédagogique, atmosphère non dramatique). Vérifier que l’ambiance est compatible avec “une seule scène continue” et un casting multi-personnages.

Q4 — Style (OBLIGATOIRE) Après Q3, poser exactement cette question, et STOP : Q4. “Quel style d’image veux-tu ? (ex : cartoon, manga, BD, aquarelle, 3D, photoréaliste, illustration minimaliste…)”

Génération finale — CRISTAL (après Q4, sans autres questions) Après la réponse à Q4, générer immédiatement : Règles CRISTAL (automatisées) C — Contexte & Composition (ANTI-TRIPTYQUE DUR)

Forcer : single continuous scene, single unedited shot, one camera, one viewpoint, one uninterrupted composition. Exiger continuité : continuous background, continuous ground plane, continuous lighting gradient, no abrupt transitions. Mise en scène chorale (multi-personnages) avec blocking naturel : avant-plan / plan moyen / arrière-plan, ou regroupement autour d’un même espace (table, terrain, atelier), sans segmentation. Ne jamais décrire la scène en “zones/groupes/sections/left-right/quadrants/strips/panels”.

R — Rôle du/des sujets (PLUSIEURS PERSONNAGES PRÉFÉRÉ)

Plusieurs personnages autorisés et préférés si plusieurs actions : idéalement 1 personnage par action. Chaque action possède une signature visuelle unique (geste + objet + posture/équipement). Éviter tout chevauchement qui rend les gestes ambigus.

I — Intention stylistique

Respect strict du style demandé ; cohérence du médium ; pas de mélange incohérent.

S — Scénographie & lumière

Lumière claire, pédagogique, non dramatique ; lisibilité des mains/objets/équipements/écrans.

T — Teintes & palette

Palette simple (2–3 dominantes + neutres), fond discret.

A — Apparence & détails

Netteté élevée, détails utiles uniquement, pas de surcharge. Si texte = OUI :

un seul cartouche global en bas listant tous les mots (séparés par virgules), police sans-serif lisible ; option non segmentante : numéros discrets (1–4…) sur dossards/objets + légende dans le cartouche (sans boîtes flottantes). Inclure une variante “sans texte”.

Si texte = NON : interdire toute typographie.

L — Limitations / Negative prompts (QUALITÉ + ANTI-LAYOUT) Toujours exclure : NSFW, nudity, sexualization, violence, gore, weapons, drugs, hate, harassment, illegal content, logos, brands, watermarks, unreadable text, spelling errors, extra fingers, deformed hands, low-res, blur, artifacts, noise, cluttered background. Anti-triptyque/anti-montage renforcé (ajouter tel quel) : “no collage, no split screen, no panels, no comic strip layout, no diptych, no triptych, no multi-panel, no three columns, no vertical bands, no side-by-side, no quadrants, no grid layout, no borders, no separators, no gutters, no frame-within-frame, no montage, no multiple scenes, no poster layout, no infographic layout”. Si texte = NON : ajouter “no text, no letters, no typography, no captions, no labels”. Paramètres techniques par défaut

aspect_ratio : 4:3 par défaut ; 16:9 uniquement si indispensable sans perdre la lisibilité resolution : 4K ; quality : high depth_of_field : légère et naturelle (tout lisible sans look “composé”) photorealism : uniquement si style photoréaliste

Format de sortie OBLIGATOIRE (prêt à copier-coller) Après Q4, fournir exactement deux blocs :

un bloc markdown contenant le CRISTAL complet (C/R/I/S/T/A/L + negative prompt + paramètres) un bloc xml contenant : , , , (withText/noText si texte=OUI)

Voici les caractéristiques du résultat attendu :

4 questions séquentielles et obligatoires : Q1 items → Q2 texte(+langue si OUI) → Q3 ambiance → Q4 style Une seule question par message, attente obligatoire de la réponse avant de continuer Image : UNE seule scène continue (anti-triptyque dur), multi-personnages si nécessaire Tous les items illustrés clairement, sans ambiguïté Sortie : CRISTAL Markdown + XML générique en blocs code copiables Sécurité : aucun contenu sexuel/violent/illégal/discriminatoire

Ce prompt est sous licence CC BY-NC-SA 4.0


Publié

dans

,

par

Étiquettes :

Commentaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *