1. Introduction

La popularité sans précédent de ChatGPT marque un changement de paradigme dans la manière dont les individus interagissent avec la technologie à des fins éducatives. Cet article étudie la compétence naissante de l'ingénierie des prompts chez des lycéens apprenant l'anglais comme langue étrangère (ALE). Bien que les grands modèles de langage (LLM) comme ChatGPT offrent un potentiel immense pour soutenir le développement de l'écriture, leur efficacité dépend de la capacité de l'utilisateur à formuler des instructions précises et efficaces. Cette étude capture les processus en temps réel, par essais et erreurs, des utilisateurs novices, analysant le contenu, la qualité et l'évolution de leurs prompts pour accomplir une tâche d'écriture définie. Les résultats révèlent des parcours comportementaux distincts, soulignant le besoin urgent d'une éducation structurée à l'ingénierie des prompts dans les programmes d'ALE pour faire passer les élèves d'une expérimentation inefficace à une collaboration stratégique avec l'IA.

2. Revue de la littérature & Contexte

2.1 L'essor des chatbots SOTA

Les chatbots d'IA générative de pointe (SOTA), dont ChatGPT est l'archétype, représentent un bond quantique par rapport à leurs prédécesseurs basés sur des règles. Alimentés par des modèles de langage à réseaux neuronaux entraînés sur de vastes corpus, ils génèrent du texte semblable à celui d'un humain sur la base de prédictions probabilistes, permettant des interactions plus flexibles et contextuelles (Caldarini et al., 2022). « ChatGPT » est de plus en plus utilisé comme un terme générique pour cette classe d'IA, établissant une nouvelle norme de performance.

2.2 L'ingénierie des prompts comme compétence critique

L'ingénierie des prompts est l'art et la science de concevoir des entrées pour guider un LLM vers une sortie souhaitée. Ce n'est pas seulement une compétence technique, mais une forme de pensée computationnelle et de conscience métalinguistique. Les prompts efficaces nécessitent souvent de la clarté, du contexte, des contraintes et des exemples (apprentissage par quelques exemples). Pour les utilisateurs non techniques, cela représente une courbe d'apprentissage significative, souvent caractérisée par des suppositions itératives.

2.3 L'IA dans l'éducation en anglais langue étrangère

La recherche sur l'IA dans l'apprentissage des langues s'est concentrée sur l'évaluation automatique de l'écriture (AWE) et les systèmes de tutorat intelligents. La nature interactive et générative des chatbots SOTA introduit une nouvelle dynamique – faisant passer le rôle de l'apprenant de récepteur de feedback à directeur d'un outil cognitif. Cela nécessite de nouvelles littératies, combinant les compétences d'écriture traditionnelles avec des stratégies d'interaction avec l'IA.

3. Méthodologie

3.1 Participants & Collecte des données

L'étude a impliqué des lycéens apprenant l'anglais langue étrangère à Hong Kong, sans expérience préalable des chatbots SOTA. Les participants avaient pour tâche de réaliser un devoir d'écriture spécifique (par exemple, une dissertation argumentative ou un paragraphe descriptif) en utilisant ChatGPT. Les données primaires consistaient en enregistrements d'écran d'iPad, capturant la séquence complète des prompts, des réponses de ChatGPT et de toutes les révisions effectuées par les élèves.

3.2 Cadre d'analyse

Une approche qualitative par étude de cas a été employée. Les enregistrements d'écran ont été transcrits et codés selon deux dimensions principales : (1) Contenu du prompt (par exemple, spécification de la tâche, demandes de style, commandes de révision) et (2) Modèle d'interaction (par exemple, nombre de tours, adaptation basée sur la sortie). Les modèles ont été regroupés pour identifier des parcours d'utilisateurs distincts.

4. Résultats : Quatre parcours d'ingénierie des prompts

L'analyse des enregistrements d'écran a révélé quatre parcours prototypiques, représentant différentes combinaisons d'approche stratégique et de sophistication des prompts.

Répartition des parcours

Basée sur les modèles observés dans la cohorte.

  • Le Minimaliste : ~35 %
  • Le Raffineur Itératif : ~30 %
  • Le Planificateur Structuré : ~20 %
  • L'Explorateur Conversationnel : ~15 %

4.1 Le Minimaliste

Ces utilisateurs saisissent des prompts très brefs, souvent d'une seule phrase, reflétant l'instruction de la tâche originale (par exemple, « Écris une dissertation sur le changement climatique »). Ils présentent une faible tolérance à l'itération ; si la sortie initiale n'est pas satisfaisante, ils sont susceptibles d'abandonner l'outil ou de soumettre le résultat médiocre. Ce parcours reflète une conception erronée de l'outil-comme-oracle.

4.2 Le Raffineur Itératif

Ce groupe commence par un prompt simple mais s'engage dans un processus de raffinement linéaire. Sur la base de la sortie de l'IA, ils émettent des commandes de suivi comme « rallonge-le », « utilise des mots plus simples » ou « ajoute plus d'exemples ». L'interaction est réactive et incrémentale, démontrant une compréhension émergente de la réactivité de l'IA aux instructions, mais manquant d'un plan global.

4.3 Le Planificateur Structuré

Une minorité d'élèves a abordé la tâche avec une structure préméditée. Leurs prompts initiaux étaient complets, spécifiant le format, le ton, les points clés, et fournissant parfois un plan (par exemple, « Écris une dissertation en 5 paragraphes plaidant pour les énergies renouvelables. Paragraphe 1 : Introduction. Paragraphe 2 : Avantages économiques... Utilise un ton formel. »). Ce parcours produit des sorties de meilleure qualité avec moins de tours, indiquant une décomposition de tâche et une planification métacognitive avancées.

4.4 L'Explorateur Conversationnel

Ces utilisateurs traitent ChatGPT comme un partenaire de dialogue. Au lieu de simplement émettre des commandes, ils posent des méta-questions (« Comment puis-je améliorer mon énoncé de thèse ? ») ou demandent des explications (« Pourquoi as-tu choisi ce mot ? »). Ce parcours mélange l'assistance à l'écriture avec l'apprentissage de l'écriture, bien qu'il puisse errer et ne pas accomplir efficacement la tâche principale.

5. Discussion & Implications

5.1 Aller au-delà de l'essai-erreur

La prévalence des parcours Minimaliste et Raffineur Itératif met en lumière un écart critique. Livrés à eux-mêmes, la plupart des élèves ne développent pas spontanément des stratégies sophistiquées d'ingénierie des prompts. Leur processus est inefficace et ne parvient souvent pas à exploiter pleinement les capacités de l'IA, risquant de renforcer des habitudes d'apprentissage passives.

5.2 Intégration pédagogique

L'étude plaide pour une éducation explicite à l'ingénierie des prompts dans la classe d'écriture en ALE. Cela devrait inclure :

  • Instruction directe : Enseigner les composants d'un prompt (rôle, tâche, contexte, contraintes, exemples).
  • Cadres structurés : Introduire des modèles comme RTF (Rôle, Tâche, Format) ou CRISPE (Capacité, Rôle, Insight, Énoncé, Personnalité, Expérimentation).
  • Critique et analyse : Évaluer les sorties générées par l'IA pour comprendre la relation de cause à effet entre le prompt et le produit.
  • Considérations éthiques : Discuter de la paternité, du plagiat et de l'évaluation critique du contenu de l'IA.

L'objectif est de cultiver des élèves qui soient des directeurs stratégiques plutôt que des consommateurs passifs du texte généré par l'IA.

6. Analyse technique & Cadre

Idée centrale, Logique, Forces & Faiblesses, Perspectives actionnables

Idée centrale : Cet article livre une vérité cruciale et souvent négligée : la démocratisation des outils d'IA comme ChatGPT ne démocratise pas automatiquement la compétence. L'interface est trompeusement simple, mais la charge cognitive d'une interaction efficace est élevée. Le véritable goulot d'étranglement dans la « classe augmentée par l'IA » n'est pas l'accès à la technologie ; c'est le manque de littératie interactionnelle. L'étude déplace brillamment l'attention de la sortie de l'IA vers l'entrée de l'humain, exposant la courbe d'apprentissage brute et sans fard.

Logique : L'argumentation est méthodique et convaincante. Elle commence par établir le problème (les chatbots SOTA nécessitent un promptage habile), introduit le manque de connaissances (comment les novices le font-ils réellement ?), présente des preuves empiriques granulaires (les quatre parcours) et conclut par un appel à l'action vigoureux (l'éducation doit s'adapter). L'utilisation d'études de cas ancre la théorie dans la réalité complexe.

Forces & Faiblesses : La force majeure est sa validité écologique. L'utilisation d'enregistrements d'écran d'utilisateurs novices dans un contexte de tâche réelle fournit des données authentiques que les études en laboratoire manquent souvent. La typologie à quatre parcours est intuitive et fournit un cadre puissant aux éducateurs pour diagnostiquer le comportement des élèves. La faiblesse principale, reconnue par les auteurs, est l'échelle. Il s'agit d'une étude de cas approfondie, pas d'une enquête large. Les parcours sont illustratifs, pas statistiquement généralisables. De plus, l'étude se concentre sur le processus, sans mesurer rigoureusement la qualité du produit écrit final entre les parcours – une prochaine étape critique.

Perspectives actionnables : Pour les éducateurs et les concepteurs de programmes, cet article est un signal d'alarme. Il fournit un mandat clair : L'ingénierie des prompts est une littératie fondamentale du 21e siècle et doit être enseignée, non pas acquise par hasard. Les écoles devraient développer des micro-leçons intégrant des cadres comme le Modèle hiérarchique des prompts, qui passe des prompts de commande de base ($P_{cmd}$) aux prompts de raisonnement itératif complexes ($P_{reason}$). Par exemple, enseigner aux élèves la formule d'un prompt de haute qualité : $P_{optimal} = R + T + C + E$, où $R$ est le Rôle, $T$ la Tâche, $C$ les Contraintes et $E$ les Exemples. Les entreprises d'EdTech devraient intégrer ces échafaudages pédagogiques directement dans leurs interfaces, offrant des modèles guidés de construction de prompts et des retours, dépassant la simple boîte de texte vide.

Détails techniques & Formulation mathématique

D'un point de vue apprentissage automatique, le prompt $p$ d'un utilisateur sert de contexte de conditionnement pour le modèle de langage $M$. Le modèle génère une séquence de sortie $o$ basée sur la distribution de probabilité $P(o | p, \theta)$, où $\theta$ représente les paramètres du modèle. Un prompt efficace réduit l'entropie de cette distribution de sortie, l'orientant vers la cible souhaitée $t$ de l'utilisateur. Le défi de l'élève est de minimiser la divergence entre la distribution des sorties possibles et son objectif, formalisé comme la minimisation de $D_{KL}(P(o|p, \theta) \,||\, P(o|t))$, où $D_{KL}$ est la divergence de Kullback–Leibler. Les utilisateurs novices, par essais et erreurs, effectuent une optimisation grossière, avec l'humain dans la boucle, de $p$ pour y parvenir.

Exemple de cas dans le cadre d'analyse

Scénario : Un élève doit écrire une lettre persuasive au proviseur de l'école pour demander la mise en place d'un programme de recyclage.

Parcours Minimaliste (Inefficace) :
Prompt 1 : « Écris une lettre sur le recyclage. »
Sortie : Une lettre générique et fade.
Action de l'élève : Soumet la sortie avec des modifications mineures.

Parcours Planificateur Structuré (Efficace - Utilisant le cadre RTF) :
Prompt 1 : « Agis comme un élève de seconde préoccupé. Écris une lettre persuasive formelle à un proviseur de lycée. L'objectif est de le convaincre de mettre en œuvre un programme complet de recyclage du plastique et du papier dans la cantine et les salles de classe. Utilise un ton respectueux mais urgent. Inclus trois arguments : 1) Impact environnemental, 2) Opportunités d'engagement/leadership des élèves, 3) Potentiel d'économies ou de subventions. Formate la lettre avec une date, une salutation, des paragraphes pour chaque argument et une signature de clôture. »
Sortie : Une lettre bien structurée, ciblée et persuasive.
Action de l'élève : Examine la sortie, peut demander un raffinement : « Renforce le troisième argument sur les économies en ajoutant une statistique. »

Ce contraste démontre comment l'application d'un simple cadre structuré (Rôle : élève, Tâche : écrire une lettre, Format : formel avec des arguments spécifiques) améliore considérablement l'efficacité et la qualité de la collaboration avec l'IA.

Résultats expérimentaux & Description du graphique

Les résultats clés de l'étude sont qualitatifs, capturés dans les descriptions des parcours. Une extension quantitative hypothétique pourrait produire un graphique comme : « Figure 1 : Efficacité de l'interaction vs. Qualité de la sortie par parcours. » L'axe des x représenterait le nombre de tours de prompts (inverse de l'efficacité), et l'axe des y représenterait le score de qualité du texte final (par exemple, évalué via une grille). Nous nous attendrions à :
- Le Minimaliste se regrouper dans le quadrant haute efficacité (peu de tours) mais faible qualité.
- Le Raffineur Itératif montrerait un nombre de tours moyen à élevé avec une qualité variable.
- Le Planificateur Structuré occuperait le quadrant haute efficacité, haute qualité (peu de tours, score élevé).
- L'Explorateur Conversationnel serait dans le quadrant faible efficacité (beaucoup de tours) avec une qualité variable, potentiellement élevée si l'exploration est ciblée. Cette visualisation argumenterait puissamment que le parcours Planificateur Structuré représente la cible optimale pour l'instruction.

7. Applications futures & Orientations

Les implications de cette recherche s'étendent au-delà de la classe d'ALE :

  • Tuteurs de promptage adaptatif : Développement de tuteurs alimentés par l'IA qui analysent l'historique des prompts d'un élève, diagnostiquent son parcours et offrent un retour en temps réel et échafaudé pour le guider vers des stratégies plus efficaces (par exemple, « Essaye de spécifier ton public dans le prochain prompt »).
  • Littératie transdisciplinaire : Intégrer l'ingénierie des prompts dans l'éducation STEM pour la génération de code, les requêtes d'analyse de données et les explications scientifiques, comme le préconisent des institutions comme l'initiative RAISE du MIT.
  • Préparation à la vie active : Comme le notent les rapports du Forum économique mondial, l'ingénierie des prompts devient rapidement une compétence valorisée dans toutes les professions. L'enseignement secondaire doit préparer les élèves à cette réalité.
  • Études longitudinales : Suivre comment les compétences en ingénierie des prompts se développent avec l'instruction, et comment elles corrèlent avec les améliorations des compétences traditionnelles d'écriture et de pensée critique.
  • Promptage multimodal : La recherche future doit explorer l'ingénierie des prompts pour l'IA multimodale (par exemple, DALL-E, Sora), où les instructions impliquent des contraintes visuelles, temporelles et stylistiques – une frontière de littératie plus complexe.

8. Références

  1. Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
  2. Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. [Manuscrit en préparation].
  3. Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.
  4. Moor, J. (2006). The Dartmouth College Artificial Intelligence Conference: The Next Fifty Years. AI Magazine, 27(4), 87–91.
  5. MIT RAISE. (2023). Day of AI Curriculum. Massachusetts Institute of Technology. Récupéré de [https://www.dayofai.org/]
  6. World Economic Forum. (2023). Future of Jobs Report 2023.
  7. Reynolds, L., & McDonell, K. (2021). Prompt Programming for Large Language Models: Beyond the Few-Shot Paradigm. Extended Abstracts of the 2021 CHI Conference on Human Factors in Computing Systems.