Ce qu'est vraiment l'ingénierie de prompts.
L'ingénierie de prompts consiste à concevoir des entrées pour les grands modèles de langage afin qu'ils produisent des sorties fiables et de haute qualité. C'est à la fois de la programmation, de l'interview et de l'écriture.
Un LLM est une machine probabiliste. Il échantillonne la continuation la plus probable de votre texte. Le prompt n'est pas une requête. C'est une configuration.
« Vous ne demandez pas au modèle. Vous programmez la distribution depuis laquelle il échantillonne. »
Pourquoi ça compte maintenant
- Coût — un prompt précis utilise moins de tokens et évite les reprises.
- Qualité — l'écart entre un prompt banal et un prompt ingénié est souvent la différence entre inutile et déployable.
- Fiabilité — les prompts conçus donnent des sorties cohérentes d'une exécution à l'autre.
- Portabilité — les prompts structurés se transfèrent proprement entre modèles.
Les six composants d'un grand prompt.
Presque chaque prompt de niveau mondial possède ces éléments. En enlever un fait chuter la qualité.
1. Rôle / Persona
Ancrez le modèle dans une identité précise. « Correcteur senior avec 15 ans dans la grande presse » bat « bon écrivain ».
2. Contexte
Ce que le modèle doit savoir : l'audience, la situation, les données environnantes.
3. Tâche
L'instruction à l'impératif. Une seule tâche centrale par prompt.
4. Contraintes
Longueur, ton, choses à éviter, choses à toujours inclure.
5. Format de sortie
Liste ? JSON ? Tableau markdown ? Le modèle improvise si on ne lui dit rien.
6. Exemples (few-shot)
Un ou deux exemples entrée→sortie est le levier le plus puissant que vous puissiez utiliser.
Techniques, classées par efficacité.
Few-shot prompting
Fournissez 1–5 exemples entrée→sortie. Si vous ne faites qu'une chose, faites celle-ci.
Chaîne de pensée (CoT)
Ajoutez « raisonne étape par étape ». Améliore massivement les mathématiques, la logique, les problèmes multi-étapes.
Role prompting
« Tu es un... » avec précision. Tire le modèle vers la bonne zone de son entraînement.
Prompt négatif
Dites-lui ce qu'il ne faut PAS faire. « N'utilisez pas les mots synergie, levier ou robuste. »
ReAct (Raison + Action)
Intercalez le raisonnement avec les appels d'outils. Fondement de tout agent sérieux.
Les prompts qui réfléchissent.
Pour le raisonnement ou la logique multi-étapes, vous devez donner de l'espace au modèle.
Le modèle penser-puis-répondre
D'abord, réfléchis au problème dans des balises <brouillon>.
Considère les cas limites. Liste tes hypothèses.
Puis donne ta réponse finale dans des balises <réponse>.
« Le raisonnement, c'est simplement donner au modèle la permission d'écrire davantage avant de décider. »
Spécificités par modèle.
Claude
Adore les balises XML : <role>, <task>, <context>. Instruction la plus importante en premier.
GPT-4 / 5
Markdown en priorité. En-têtes ##, listes numérotées. Répond bien aux instructions « étape 1, étape 2 ».
Gemini
Les exemples en premier. 1–2 démonstrations avant la tâche. Fort en multimodal.
Llama / open
Restez concis. Un exemple, tâche claire, fin.
Mistral
Direct, instructionnel. Préfère la brièveté.
Universel
Sections markdown, pas de syntaxe propriétaire, format explicite, un exemple.
Itération et évaluation.
On n'écrit pas un bon prompt. On itère jusqu'à lui.
La boucle d'itération
- Exécutez le prompt sur 5–10 entrées représentatives.
- Notez chaque sortie selon un barème que vous définissez.
- Diagnostiquez la pire sortie. Demandez-vous pourquoi elle a échoué.
- Corrigez le prompt pour résoudre cette défaillance précise.
- Relancez pour vérifier que la correction n'a pas cassé les cas qui fonctionnaient.
« Les meilleurs ingénieurs de prompts sont aussi les meilleurs à admettre que leur prompt est mauvais et à le corriger. »
Les pièges à éviter.
Rôles vagues
« Tu es un expert » ne veut rien dire. Précisez le domaine, le niveau, le contexte.
Tâches composées
Six tâches dans un prompt → résultat médiocre sur toutes. Découpez.
Pas de format spécifié
Sans format précis, le modèle improvise. Spécifiez toujours la structure.
Hypothèses implicites
Rendez chaque hypothèse explicite — audience, ton, interdits, contraintes.
Faire confiance au premier résultat
Exécutez le prompt 5 fois. La variance révèle sa fiabilité réelle.