Un prompt pour générer des dialogues dans ton cours de langue

Grâce au module Native Speech Generation intégré à Google AI Studio, il n’a jamais été aussi facile de créer des dialogues audio pour ses cours de langues. Pour aller encore plus loin, nous t’avons concocté un super prompt capable de générer des dialogues comme les plus grands dialoguistes.

Grâce ce prompt, tu vas pouvoir générer une infinité de dialogues paramétrés exactement selon tes souhaits.

Description du prompt

  • Ce prompt va pouvoir te permettre de générer des dialogues audio sur une thématique de ton choix et dans la langue sélectionnée.
  • Le dialogue ainsi créé respectera le niveau CECRL que tu souhaites.
  • Tu devras configurer de manière textuel le prompt en modifiant la valeur des variables en son sein (tout ce qui est après la virgule).
  • Par ailleurs, tu peux configurer plusieurs locuteurs et qu’ils aient chacun une personnalité propre.
  • Enfin, tu peux déterminer un arc narratif qui accrochera tes apprenants.

Objectif(s) du prompt

  • Le prompt génère un dialogue pour qu’il soit synthétisé vocalement au format .wav dans le module Native Speech Generation de Google AI Studio.
  • L’idée est d’utiliser ensuite le fichier généré dans une leçon ou des exercices.

Prompt à récupérer

Vu la personnalisation avancée du prompt et le nombre de variables à modifier, il n’est pas très opérant de réaliser un formulaire générant un prompt personnalisé par l’utilisateur. Dès lors, contrairement à d’autres requêtes élaborées dans la banque de prompts, tu vas devoir modifier le prompt dans un éditeur de texte pour qu’il réponde à tes besoins.
Par exemple si tu veux trois interlocuteurs, tu vas devoir ajouter par copier/coller un troisième interlocuteur à la section « Définition des personnages ».

Pour éditer ce prompt, veille à respecter ces recommendations:

  • Remplis les variables ci-dessous avec les informations spécifiques. Par exemple, si tu veux 2 locuteurs à ton dialogue, la valeur de la variable devient {{Nombre de locuteurs}} = « 2 ».
  • Ajoute et supprime autant de lignes {{Description Speaker X}} que nécessaire, correspondant au {{Nombre de locuteurs}}.
  • Pour chaque locuteur, fournis : Nom (pour référence), Rôle/Description, Ton/Style vocal spécifique, Émotion principale.
  • Le nom du personnage aide à définir le personnage pour l’IA.
  • Tu ne dois pas modifier la section PROMPT POUR L’IA GÉNÉRATRICE DE DIALOGUE

Pour utiliser le prompt, c’est très simple, il faut:

  • remplacer toutes les valeurs des variables du prompt initial, en éditant tout ce qui est après la virgule selon l’exemple fourni plus bas, en fonction de tes souhaits;
  • coller le prompt édité et générer une nouvelle réponse dans un nouveau Chat grâce à Gemini ou Google AI Studio.
  • coller la réponse de ce prompt en remplaçant le texte initial présent dans le Module Native Speech Generation au niveau de la section Raw Structure.


Cliquer sur le Module Native Speech
Il faut éditer Raw Structure


Formulaire Interactif

//Variables

— Locuteurs (Speakers) —

{{Nombre de locuteurs}} = ”[REMPLIR (ex: 2) # Sera utilisé pour générer « Speaker 1 », « Speaker 2 », etc.]”

— Choix de la langue et niveau de langue —

{{Langue du dialogue}} = « [Ex: Français (France), Anglais (US), Espagnol] »

{{Niveau de langue du CECRL}} = “[Ex: A1, A2, B1, B2, C1, C2] »

— Caractéristiques du Dialogue —

{{Instruction de ton pour la lecture à voix haute}} = « [Décrire le ton général souhaité pour la lecture globale du dialogue. Ex: warm, welcoming; dramatic, tense; informative, neutral; lighthearted, amusing] »

{{Durée approximative souhaitée du dialogue (hors instruction de ton)}} = « [Ex: 30 secondes, 2 minutes, 10 minutes]. L’IA adaptera le nombre et la longueur des répliques pour viser cette durée. »

{{Nombre total approximatif de répliques (indicatif, l’IA priorisera la durée)}} = « [REMPLIR (ex: 20)] »

{{Instructions spécifiques supplémentaires (optionnel)}} = « [Toute autre contrainte ou directive importante. Ex: Éviter le jargon technique excessif. Un des personnages a un tic de langage spécifique. Le dialogue doit se terminer sur une question ouverte.] »

— Définition des personnages —

{{Description Speaker 1 (Nom interne, Rôle/Description, Ton/Style vocal spécifique, Émotion principale)}} = « Nom interne: [Ex: Sarah], Rôle: [Description de son rôle/personnalité], Ton spécifique: [Ex: calme, enjoué, sarcastique], Émotion: [Ex: joie, surprise, méfiance] »

{{Description Speaker 2 (Nom interne, Rôle/Description, Ton/Style vocal spécifique, Émotion principale)}} = « Nom interne: [Ex: Marc], Rôle: [Description de son rôle/personnalité], Ton spécifique: [Ex: autoritaire, hésitant, doux], Émotion: [Ex: colère, curiosité, tristesse] »

— Scène et Scénario —

{{Contexte général de la scène}} = « [Décrire le lieu, le moment, l’ambiance générale. Ex: Un bureau high-tech tard le soir, ambiance tendue.] »

{{Scénario général du dialogue}} = « [Que se passe-t-il globalement dans cette conversation ? Quel est le sujet principal ? Ex: Deux collègues débattent d’une découverte scientifique majeure.] »

{{Objectifs spécifiques de la conversation}} = « [Quel est le but précis de ce dialogue ? Que doivent accomplir ou révéler les personnages ? Ex: Speaker 1 doit convaincre Speaker 2 de la validité de sa théorie, Speaker 2 doit exprimer ses doutes fondés.] »

{{Éléments ou événements clés à inclure (optionnel)}} = « [Y a-t-il des informations spécifiques, des rebondissements, des objets mentionnés ou des actions qui doivent impérativement apparaître ? Ex: À un moment, une alarme se déclenche.] »

//PROMPT POUR L’IA GÉNÉRATRICE DE DIALOGUE (Ne pas modifier cette section ci-dessous)

Tu es un Scénariste et Dialoguiste expert en création de scripts pour la synthèse vocale, spécifiquement pour des systèmes comme « Native Speech Generation » de Google AI Studio qui requièrent une instruction de ton initiale.

Tu maîtrises la formulation d’instructions de ton claires, la compréhension fine des dynamiques de conversation, la création de personnages crédibles avec des voix distinctes (même s’ils sont désignés « Speaker 1 », « Speaker 2 », etc.), l’adaptation du ton et du style en fonction des émotions et des situations, la structuration de dialogues pour une lecture naturelle par des voix de synthèse, et la gestion de la longueur et du rythme pour correspondre à une durée cible.

Mon contexte est que j’ai besoin d’un script de dialogue structuré et prêt à l’emploi pour le module « Native Speech Generation » de Google AI Studio, en utilisant les paramètres que j’ai définis et remplis dans la section « # Ma Configuration de Dialogue » ci-dessus.

Ces paramètres sont impératifs et doivent être scrupuleusement respectés. Mon objectif est d’obtenir un script que je peux directement coller dans la partie « Raw structure » de l’outil de Google, commençant par une instruction de ton, suivie du dialogue des speakers, et dont la longueur du dialogue correspond approximativement à la durée que j’ai spécifiée.

Tu vas créer une instruction de ton suivie d’un dialogue complet et détaillé en suivant exclusivement les directives de ma section « # Ma Configuration de Dialogue ».

Pour ça, voici les étapes à suivre :

  1. Analyse attentivement tous les paramètres que j’ai fournis dans « # Ma Configuration de Dialogue ».

  2. Prends la valeur de {{Instruction de ton pour la lecture à voix haute}} et formule une phrase d’instruction claire pour la lecture, typiquement commençant par « Read aloud in a… » ou une formulation équivalente adaptée à la description. Cette phrase sera la toute première ligne de la sortie.

  3. Identifie le {{Nombre de locuteurs}}. Tu attribueras les répliques en utilisant « Speaker 1: », « Speaker 2: », et ainsi de suite, en fonction de ce nombre.

  4. Pour chaque « Speaker X », inspire-toi de sa {{Description Speaker X (Nom interne, Rôle/Description, Ton/Style vocal spécifique, Émotion principale)}} pour lui donner une voix, une personnalité et des réactions cohérentes dans le dialogue qui suit l’instruction de ton. Le « Nom » est pour ta compréhension du personnage, il ne doit pas apparaître dans le script. Le « Ton/Style vocal spécifique » de chaque speaker peut nuancer ou contraster avec l’instruction de ton globale, ce qui est normal

  5. Construis une conversation fluide, cohérente et naturelle qui respecte le {{Niveau de langue du CECRL}}, le {{Contexte général de la scène}}, le {{Scénario général du dialogue}} et les {{Objectifs spécifiques de la conversation}}.

  6. Si spécifié, intègre les {{Éléments ou événements clés à inclure}} de manière organique dans la conversation.

  7. Adapte le nombre total de répliques et la longueur de chaque réplique pour que la durée totale estimée du dialogue parlé (excluant la ligne d’instruction de ton) corresponde le mieux possible à la {{Durée approximative souhaitée du dialogue}}. Prends également en compte le {{Nombre total approximatif de répliques}} comme une indication secondaire.

  8. Assure-toi que chaque réplique est attribuée clairement au bon locuteur en utilisant le format « Speaker X: » (par exemple, « Speaker 1: », « Speaker 2: »).

  9. Respecte scrupuleusement le format de sortie spécifié ci-dessous.

Voici les caractéristiques du résultat attendu :

Format de sortie strict :

  • La sortie DOIT commencer par une ligne d’instruction de ton, dérivée de {{Instruction de ton pour la lecture à voix haute}}.
  • Suivie immédiatement (à la ligne suivante) par le dialogue sous la forme Speaker 1: Réplique du locuteur 1.\nSpeaker 2: Réplique du locuteur 2.\n… et ainsi de suite. Exemple de format attendu : Read aloud in a {{Instruction de ton pour la lecture à voix haute}} tone Speaker 1: Réplique du locuteur 1. Speaker 2: Réplique du locuteur 2.
  • N’ajoute AUCUN texte avant l’instruction de ton (comme « Voici le script : ») ni après la fin du dialogue (pas de « Fin du dialogue » ou de commentaires). Chaque réplique des speakers doit se terminer par un signe de ponctuation approprié (point, point d’exclamation, point d’interrogation) suivi immédiatement d’un retour à la ligne (\n).

Contenu :

  • L’instruction de ton et le dialogue doivent être entièrement cohérents avec tous les éléments que j’ai définis dans la section « # Ma Configuration de Dialogue ».

Durée :

  • Le dialogue (hors instruction de ton) doit viser à correspondre à la {{Durée approximative souhaitée du dialogue}} spécifiée.

Langue :

  • L’instruction de ton et le dialogue doivent être générés dans la {{Langue du dialogue}} spécifiée. (Note : L’instruction « Read aloud in a… » est typiquement en anglais, mais le contenu de la description du ton et le dialogue seront dans la langue choisie).

Instructions supplémentaires :

  • Prends impérativement en compte les {{Instructions spécifiques supplémentaires (optionnel)}} pour le contenu du dialogue.

Si c’est OK pour toi, génère l’instruction de ton suivie du dialogue en te basant uniquement et strictement sur la configuration fournie. Ne pose pas de questions, n’ajoute pas de commentaires, fournis directement le résultat au format demandé.

Exemple du prompt utilisé dans un dialogue au restaurant et fichier audio généré

Le prompt édité

Il s’agit d’une scène au restaurant entre 3 locuteurs: un couple qui fête son anniversaire de mariage et un serveur.

Le prompt édité : La scène au restaurant

//Variables

— Locuteurs (Speakers) —

{{Nombre de locuteurs}} = ”3”

— Choix de la langue et niveau de langue —

{{Langue du dialogue}} = “Anglais (US) »

{{Niveau de langue du CECRL}} = “B1″

— Caractéristiques du Dialogue —

{{Instruction de ton pour la lecture à voix haute}} = « lighthearted, amusing ».

{{Durée approximative souhaitée du dialogue (hors instruction de ton)}} = « 3 minutes »

{{Nombre total approximatif de répliques (indicatif, l’IA priorisera la durée)}} = 30

{{Instructions spécifiques supplémentaires (optionnel)}} = « Essaie que le dialogue soit amusant. »

— Définition des personnages —

{{Description Speaker 1 (Nom, Rôle/Description, Ton/Style vocal spécifique, Émotion principale)}} = « Nom: Sarah, Rôle: Compagne de Jules et enseignante, Ton spécifique: calme et enjouée, Émotion: joie »

{{Description Speaker 2 (Nom, Rôle/Description, Ton/Style vocal spécifique, Émotion principale)}} = « Nom: Jules, Rôle: Compagnon de Sarah et ingénieur, Ton spécifique: hésitant et doux, Émotion: curiosité, tristesse »

{{Description Speaker 3 (Nom, Rôle/Description, Ton/Style vocal spécifique, Émotion principale)}} = « Nom: Bart, Rôle: serveur du restaurant, Ton spécifique: assertif et patient, Émotion: neutre »

— Scène et Scénario —

{{Contexte général de la scène}} = « Repas au restaurant. Jules a invité Sarah pour leur anniversaire de mariage. C’est la première fois qu’ils vont dans ce restaurant chic et étoilé. Ils n’ont pas l’habitude. »

{{Scénario général du dialogue}} = « Ils ne savent pas comment se comporter dans cet endroit guindé et le serveur les conseille »

{{Objectifs spécifiques de la conversation}} = « Passer en revue certains plats, ingrédients et tout se qui concerne l’art de la table dans le cadre de cours de langues. »

{{Éléments ou événements clés à inclure (optionnel)}} = « Sarah renverse un verre de vin sur la nappe blanche. Prévois les interactions entre les protagonistes »

//PROMPT POUR L’IA GÉNÉRATRICE DE DIALOGUE (Ne pas modifier cette section ci-dessous)

Tu es un Scénariste et Dialoguiste expert en création de scripts pour la synthèse vocale, spécifiquement pour des systèmes comme « Native Speech Generation » de Google AI Studio qui requièrent une instruction de ton initiale. Tu maîtrises la formulation d’instructions de ton claires, la compréhension fine des dynamiques de conversation, la création de personnages crédibles avec des voix distinctes (même s’ils sont désignés « Speaker 1 », « Speaker 2 », etc.), l’adaptation du ton et du style en fonction des émotions et des situations, la structuration de dialogues pour une lecture naturelle par des voix de synthèse, et la gestion de la longueur et du rythme pour correspondre à une durée cible.

Mon contexte est que j’ai besoin d’un script de dialogue structuré et prêt à l’emploi pour le module « Native Speech Generation » de Google AI Studio, en utilisant les paramètres que j’ai définis et remplis dans la section « # Ma Configuration de Dialogue » ci-dessus. Ces paramètres sont impératifs et doivent être scrupuleusement respectés. Mon objectif est d’obtenir un script que je peux directement coller dans la partie « Raw structure » de l’outil de Google, commençant par une instruction de ton, suivie du dialogue des speakers, et dont la longueur du dialogue correspond approximativement à la durée que j’ai spécifiée.

Tu vas créer une instruction de ton suivie d’un dialogue complet et détaillé en suivant exclusivement les directives de ma section « # Ma Configuration de Dialogue ».

Pour ça, voici les étapes à suivre :

  1. Analyse attentivement tous les paramètres que j’ai fournis dans « # Ma Configuration de Dialogue ».
  2. Prends la valeur de {{Instruction de ton pour la lecture à voix haute}} et formule une phrase d’instruction claire pour la lecture, typiquement commençant par « Read aloud in a… » ou une formulation équivalente adaptée à la description. Cette phrase sera la toute première ligne de la sortie.
  3. Identifie le {{Nombre de locuteurs}}. Tu attribueras les répliques en utilisant « Speaker 1: », « Speaker 2: », et ainsi de suite, en fonction de ce nombre.
  4. Pour chaque « Speaker X », inspire-toi de sa {{Description Speaker X (Nom interne, Rôle/Description, Ton/Style vocal spécifique, Émotion principale)}} pour lui donner une voix, une personnalité et des réactions cohérentes dans le dialogue qui suit l’instruction de ton. Le « Nom interne » est pour ta compréhension du personnage, il ne doit pas apparaître dans le script. Le « Ton/Style vocal spécifique » de chaque speaker peut nuancer ou contraster avec l’instruction de ton globale, ce qui est normal.
  5. Construis une conversation fluide, cohérente et naturelle qui respecte le {{Niveau de langue du CECRL}}, le {{Contexte général de la scène}}, le {{Scénario général du dialogue}} et les {{Objectifs spécifiques de la conversation}}.
  6. Si spécifié, intègre les {{Éléments ou événements clés à inclure}} de manière organique dans la conversation.
  7. Adapte le nombre total de répliques et la longueur de chaque réplique pour que la durée totale estimée du dialogue parlé (excluant la ligne d’instruction de ton) corresponde le mieux possible à la {{Durée approximative souhaitée du dialogue}}. Prends également en compte le {{Nombre total approximatif de répliques}} comme une indication secondaire.
  8. Assure-toi que chaque réplique est attribuée clairement au bon locuteur en utilisant le format « Speaker X: » (par exemple, « Speaker 1: », « Speaker 2: »).
  9. Respecte scrupuleusement le format de sortie spécifié ci-dessous.

Voici les caractéristiques du résultat attendu :

  • Format de sortie strict : La sortie DOIT commencer par une ligne d’instruction de ton, dérivée de {{Instruction de ton pour la lecture à voix haute}}. Suivie immédiatement (à la ligne suivante) par le dialogue sous la forme Speaker 1: Réplique du locuteur 1.\nSpeaker 2: Réplique du locuteur 2.\n… et ainsi de suite. Exemple de format attendu : Read aloud in a {{Instruction de ton pour la lecture à voix haute}} tone Speaker 1: Réplique du locuteur 1. Speaker 2: Réplique du locuteur 2. N’ajoute AUCUN texte avant l’instruction de ton (comme « Voici le script : ») ni après la fin du dialogue (pas de « Fin du dialogue » ou de commentaires). Chaque réplique des speakers doit se terminer par un signe de ponctuation approprié (point, point d’exclamation, point d’interrogation) suivi immédiatement d’un retour à la ligne (\n).
  • Contenu : L’instruction de ton et le dialogue doivent être entièrement cohérents avec tous les éléments que j’ai définis dans la section « # Ma Configuration de Dialogue ».
  • Durée : Le dialogue (hors instruction de ton) doit viser à correspondre à la {{Durée approximative souhaitée du dialogue}} spécifiée.
  • Langue : L’instruction de ton et le dialogue doivent être générés dans la {{Langue du dialogue}} spécifiée. (Note : L’instruction « Read aloud in a… » est typiquement en anglais, mais le contenu de la description du ton et le dialogue seront dans la langue choisie).
  • Instructions supplémentaires : Prends impérativement en compte les {{Instructions spécifiques supplémentaires (optionnel)}} pour le contenu du dialogue.

Si c’est OK pour toi, génère l’instruction de ton suivie du dialogue en te basant uniquement et strictement sur la configuration fournie. Ne pose pas de questions, n’ajoute pas de commentaires, fournis directement le résultat au format demandé.

Le fichier généré au format .wav dans le module Native Speech Generation de Google AI Studio


par

Étiquettes :

Commentaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *