Incitation structurée d'un modèle de langage

L'idée : Injecter des règles de grammaire, des dictionnaires bilingues et des notes de style directement dans l'invite système du modèle de langage. Pas d'entraînement, pas d'ajustement fin — simplement des connaissances linguistiques structurées qui orientent la sortie vers des traductions valides.

:::info Ceci est un guide pratique, non une implémentation finalisée Ce guide esquisse l'approche et ses principales décisions de conception. Adaptez-le à votre paire de langues, aux ressources disponibles et à vos objectifs d'évaluation. :::

Quand utiliser cette approche

Vous disposez de connaissances linguistiques sur la langue cible (règles de grammaire, entrées de dictionnaire, préférences de style) mais pas assez de données parallèles pour l'ajustement fin
Vous souhaitez itérer rapidement — les modifications d'invite se déploient en secondes, sans réentraînement
La langue cible présente des motifs connus que le modèle de langage traite mal (accord en genre, conventions d'écriture, niveaux de formalité)
Vous souhaitez comparer l'incitation structurée à une ligne de base et itérer sur ce qui fonctionne

Fonctionnement

Assembler les données d'incitation — règles de grammaire, dictionnaire bilingue et notes de style dans un fichier JSON structuré
Configurer le registre — un préfixe d'invite système qui définit la langue, l'écriture et le ton
Exécuter le harness — les données d'incitation sont injectées dans chaque invite du modèle de langage
Examiner les défaillances — regardez ce que la porte de qualité rejette, ajoutez des règles pour traiter les motifs
Itérer — chaque révision du fichier d'incitation est une nouvelle expérience ; le harness les suit toutes

Structure des données d'incitation

coaching/<locale>.json
{
  "grammar_rules": [
    "Adjectives agree in gender and number with the noun they modify",
    "Use formal register (vous) for all UI text",
    "Preserve interpolation variables exactly: {{name}}, {count}"
  ],
  "dictionary": {
    "dashboard": "tableau de bord",
    "settings": "paramètres",
    "deploy": "déployer"
  },
  "style_notes": "Prefer active voice. Avoid anglicisms where a native term exists. Keep sentences concise for UI readability."
}

Principales décisions de conception

Spécificité des règles vs. fenêtre de contexte : Plus de règles donnent au modèle de langage plus de conseils, mais consomment la fenêtre de contexte disponible pour la traduction réelle. Commencez par 5–10 règles à fort impact et n'en ajoutez d'autres que lorsque vous observez des motifs d'échec spécifiques.

Couverture du dictionnaire : Vous n'avez pas besoin d'un dictionnaire complet — concentrez-vous sur les termes que le modèle de langage traite systématiquement mal. Même 20–30 termes forcés peuvent améliorer considérablement la cohérence.

L'ordre des règles compte : Placez les règles les plus importantes en premier. Les modèles de langage accordent plus d'attention aux instructions précoces.

Exécution d'une expérience

python eval/baseline_experiment.py \
  --dataset data/edtekla-dev-v1.json \
  --model google/gemini-2.5-pro \
  --condition coached-v1 \
  --coaching-file coaching/crk.json

Avantages et inconvénients


✅ Coût d'entraînement nul	❌ Plafond de qualité limité par les connaissances de base du modèle de langage
✅ Itération instantanée (modifier l'invite → réexécuter)	❌ Les limites de la fenêtre de contexte restreignent la quantité d'incitation possible
✅ Fonctionne avec n'importe quel fournisseur de modèle de langage	❌ Les règles peuvent entrer en conflit — déboguer les interactions d'invite est un art
✅ Transparent — vous pouvez lire exactement ce que le modèle de langage voit	❌ Ne crée pas de nouvelles connaissances, oriente seulement les connaissances existantes

S'associe bien avec

FST-Gated Pipeline — l'incitation + la validation morphologique capture ce que l'incitation seule manque
Dictionary-Augmented LLM — la terminologie forcée est une forme d'incitation
Few-Shot Prompting — les exemples + les règles ensemble sont plus puissants que l'un ou l'autre seul

Voir aussi

Method Interface — format des données d'incitation et protocole TranslationMethod
Support a Low-Resource Language — le contexte complet
Eval Harness — comment exécuter des expériences

Quand utiliser cette approche​

Fonctionnement​

Structure des données d'incitation​

Principales décisions de conception​

Exécution d'une expérience​

Avantages et inconvénients​

S'associe bien avec​

Voir aussi​