1. Introducción

La popularidad sin precedentes de ChatGPT marca un cambio de paradigma en cómo los individuos interactúan con la tecnología con fines educativos. Este artículo investiga la habilidad incipiente de la ingeniería de prompts entre estudiantes de secundaria de Inglés como Lengua Extranjera (ILE). Si bien los Modelos de Lenguaje a Gran Escala (LLM, por sus siglas en inglés) como ChatGPT ofrecen un potencial inmenso para apoyar el desarrollo de la escritura, su eficacia depende de la capacidad del usuario para redactar instrucciones precisas y efectivas. Este estudio captura los procesos en tiempo real de ensayo y error de usuarios novatos, analizando el contenido, la calidad y la evolución de sus prompts para completar una tarea de escritura definida. Los hallazgos revelan trayectorias conductuales distintas, subrayando la necesidad urgente de una educación estructurada en ingeniería de prompts dentro de los currículos de ILE para llevar a los estudiantes de la experimentación ineficiente a la colaboración estratégica con la IA.

2. Revisión de la Literatura y Antecedentes

2.1 El Surgimiento de los Chatbots de Última Generación

Los chatbots de IA generativa de última generación (SOTA), ejemplificados por ChatGPT, representan un salto cuántico respecto a sus predecesores basados en reglas. Impulsados por modelos de lenguaje de redes neuronales entrenados en vastos corpus, generan texto similar al humano basándose en predicciones probabilísticas, permitiendo interacciones más flexibles y conscientes del contexto (Caldarini et al., 2022). "ChatGPT" se utiliza cada vez más como un término genérico para esta clase de IA, estableciendo un nuevo estándar de rendimiento.

2.2 La Ingeniería de Prompts como Habilidad Crítica

La ingeniería de prompts es el arte y la ciencia de diseñar entradas para guiar a un LLM hacia una salida deseada. No es meramente una habilidad técnica, sino una forma de pensamiento computacional y conciencia metalingüística. Los prompts efectivos a menudo requieren claridad, contexto, restricciones y ejemplos (aprendizaje con pocos ejemplos). Para usuarios no técnicos, esto presenta una curva de aprendizaje significativa, a menudo caracterizada por conjeturas iterativas.

2.3 La IA en la Educación de ILE

La investigación sobre la IA en el aprendizaje de idiomas se ha centrado en la evaluación automática de la escritura (AWE) y los sistemas de tutoría inteligente. La naturaleza interactiva y generativa de los chatbots SOTA introduce una nueva dinámica—cambiando el rol del aprendiz de receptor de retroalimentación a director de una herramienta cognitiva. Esto requiere nuevas alfabetizaciones, combinando habilidades tradicionales de escritura con estrategias de interacción con la IA.

3. Metodología

3.1 Participantes y Recolección de Datos

El estudio involucró a estudiantes de secundaria de ILE en Hong Kong sin experiencia previa en el uso de chatbots SOTA. Se les encomendó a los participantes completar una tarea de escritura específica (por ejemplo, un ensayo argumentativo o un párrafo descriptivo) utilizando ChatGPT. Los datos primarios consistieron en grabaciones de pantalla de iPad, capturando la secuencia completa de prompts, las respuestas de ChatGPT y cualquier revisión realizada por los estudiantes.

3.2 Marco Analítico

Se empleó un enfoque de estudio de caso cualitativo. Las grabaciones de pantalla se transcribieron y codificaron a lo largo de dos dimensiones principales: (1) Contenido del Prompt (por ejemplo, especificación de la tarea, solicitudes de estilo, comandos de revisión) y (2) Patrón de Interacción (por ejemplo, número de turnos, adaptación basada en la salida). Los patrones se agruparon para identificar trayectorias de usuario distintas.

4. Resultados: Cuatro Trayectorias de Ingeniería de Prompts

El análisis de las grabaciones de pantalla reveló cuatro trayectorias prototípicas, que representan diferentes combinaciones de enfoque estratégico y sofisticación del prompt.

Distribución de las Trayectorias

Basado en los patrones observados en la cohorte.

  • El Minimalista: ~35%
  • El Refinador Iterativo: ~30%
  • El Planificador Estructurado: ~20%
  • El Explorador Conversacional: ~15%

4.1 El Minimalista

Estos usuarios introducen prompts muy breves, a menudo de una sola frase que refleja la instrucción original de la tarea (por ejemplo, "Escribe un ensayo sobre el cambio climático"). Exhiben una baja tolerancia a la iteración; si la salida inicial no es satisfactoria, es probable que abandonen la herramienta o entreguen el resultado deficiente. Esta trayectoria refleja un concepto erróneo de herramienta-como-oráculo.

4.2 El Refinador Iterativo

Este grupo comienza con un prompt simple pero se involucra en un proceso de refinamiento lineal. Basándose en la salida de la IA, emiten comandos de seguimiento como "hazlo más largo", "usa palabras más simples" o "agrega más ejemplos". La interacción es reactiva e incremental, demostrando una comprensión emergente de la capacidad de respuesta de la IA a las instrucciones, pero careciendo de un plan general.

4.3 El Planificador Estructurado

Una minoría de estudiantes abordó la tarea con una estructura premeditada. Sus prompts iniciales fueron integrales, especificando formato, tono, puntos clave y, a veces, proporcionando un esquema (por ejemplo, "Escribe un ensayo de 5 párrafos argumentando a favor de la energía renovable. Párrafo 1: Introducción. Párrafo 2: Beneficios económicos... Usa un tono formal."). Esta trayectoria produce salidas de mayor calidad con menos turnos, indicando un desglose de tareas y una planificación metacognitiva avanzados.

4.4 El Explorador Conversacional

Estos usuarios tratan a ChatGPT como un compañero de diálogo. En lugar de solo emitir comandos, hacen preguntas meta ("¿Cómo puedo mejorar mi declaración de tesis?") o solicitan explicaciones ("¿Por qué elegiste esta palabra?"). Esta trayectoria combina la asistencia en la escritura con el aprendizaje sobre la escritura, aunque puede divagar y no completar eficientemente la tarea principal.

5. Discusión e Implicaciones

5.1 Ir Más Allá del Ensayo y Error

La prevalencia de las trayectorias del Minimalista y el Refinador Iterativo resalta una brecha crítica. Dejados a su suerte, la mayoría de los estudiantes no desarrollan espontáneamente estrategias sofisticadas de ingeniería de prompts. Su proceso es ineficiente y a menudo no aprovecha todas las capacidades de la IA, pudiendo reforzar hábitos de aprendizaje pasivos.

5.2 Integración Pedagógica

El estudio aboga por una educación explícita en ingeniería de prompts dentro del aula de escritura de ILE. Esto debería incluir:

  • Instrucción Directa: Enseñar los componentes de un prompt (rol, tarea, contexto, restricciones, ejemplos).
  • Marcos Estructurados: Introducir modelos como RTF (Rol, Tarea, Formato) o CRISPE (Capacidad, Rol, Perspectiva, Declaración, Personalidad, Experimento).
  • Crítica y Análisis: Evaluar las salidas generadas por la IA para comprender la relación causa-efecto entre el prompt y el producto.
  • Consideraciones Éticas: Discutir la autoría, el plagio y la evaluación crítica del contenido de la IA.

El objetivo es cultivar estudiantes que sean directores estratégicos en lugar de consumidores pasivos del texto generado por la IA.

6. Análisis Técnico y Marco de Referencia

Perspectiva Central, Flujo Lógico, Fortalezas y Debilidades, Perspectivas Accionables

Perspectiva Central: Este artículo presenta una verdad crucial y a menudo pasada por alto: la democratización de herramientas de IA como ChatGPT no democratiza automáticamente la competencia. La interfaz es engañosamente simple, pero la carga cognitiva de una interacción efectiva es alta. El verdadero cuello de botella en el "aula aumentada por IA" no es el acceso a la tecnología; es la falta de alfabetización en la interacción. El estudio cambia brillantemente el foco de la salida de la IA a la entrada del humano, exponiendo la cruda y sin pulir curva de aprendizaje.

Flujo Lógico: El argumento es metódico y convincente. Comienza estableciendo el problema (los chatbots SOTA requieren prompts hábiles), introduce la brecha de conocimiento (¿cómo lo hacen realmente los novatos?), presenta evidencia empírica granular (las cuatro trayectorias) y concluye con un llamado contundente a la acción (la educación debe adaptarse). El uso de estudios de caso fundamenta la teoría en la realidad desordenada.

Fortalezas y Debilidades: La mayor fortaleza es su validez ecológica. El uso de grabaciones de pantalla de usuarios primerizos en un contexto de tarea real proporciona datos auténticos que a menudo carecen los estudios de laboratorio. La tipología de cuatro trayectorias es intuitiva y proporciona un marco poderoso para que los educadores diagnostiquen el comportamiento de los estudiantes. La debilidad principal, reconocida por los autores, es la escala. Este es un estudio de caso profundo, no una encuesta amplia. Las trayectorias son ilustrativas, no estadísticamente generalizables. Además, el estudio se centra en el proceso, sin medir rigurosamente la calidad del producto escrito final entre trayectorias—un paso crítico siguiente.

Perspectivas Accionables: Para educadores y diseñadores de currículos, este artículo es una llamada de atención. Proporciona un mandato claro: La ingeniería de prompts es una alfabetización fundamental del siglo XXI y debe ser enseñada, no adquirida por casualidad. Las escuelas deberían desarrollar micro-lecciones integrando marcos como el Modelo de Jerarquía de Prompts, que avanza desde prompts básicos de comando ($P_{cmd}$) hasta prompts complejos de razonamiento iterativo ($P_{reason}$). Por ejemplo, enseñar a los estudiantes la fórmula para un prompt de alta calidad: $P_{optimal} = R + T + C + E$, donde $R$ es Rol, $T$ es Tarea, $C$ son Restricciones y $E$ son Ejemplos. Las empresas de EdTech deberían incorporar estos andamios pedagógicos directamente en sus interfaces, ofreciendo plantillas guiadas para construir prompts y retroalimentación, yendo más allá del cuadro de texto en blanco.

Detalles Técnicos y Formulación Matemática

Desde una perspectiva de aprendizaje automático, el prompt de un usuario $p$ sirve como contexto de condicionamiento para el modelo de lenguaje $M$. El modelo genera una secuencia de salida $o$ basada en la distribución de probabilidad $P(o | p, \theta)$, donde $\theta$ representa los parámetros del modelo. Un prompt efectivo reduce la entropía de esta distribución de salida, dirigiéndola hacia el objetivo previsto por el usuario $t$. El desafío del estudiante es minimizar la divergencia entre la distribución de salidas posibles y su objetivo, formalizado como minimizar $D_{KL}(P(o|p, \theta) \,||\, P(o|t))$, donde $D_{KL}$ es la divergencia de Kullback–Leibler. Los usuarios novatos, a través del ensayo y error, están realizando una optimización cruda, con el humano en el bucle, de $p$ para lograr esto.

Ejemplo de Caso del Marco de Análisis

Escenario: Un estudiante debe escribir una carta persuasiva al director de la escuela sobre iniciar un programa de reciclaje.

Trayectoria Minimalista (Inefectiva):
Prompt 1: "Escribe una carta sobre el reciclaje."
Salida: Una carta genérica y sosa.
Acción del Estudiante: Entrega la salida con ediciones menores.

Trayectoria del Planificador Estructurado (Efectiva - Usando el Marco RTF):
Prompt 1: "Actúa como un estudiante de 10º grado preocupado. Escribe una carta persuasiva formal al director de una escuela secundaria. El objetivo es convencerlo de implementar un programa integral de reciclaje de plástico y papel en la cafetería y las aulas. Usa un tono respetuoso pero urgente. Incluye tres argumentos: 1) Impacto ambiental, 2) Oportunidades de participación/liderazgo estudiantil, 3) Potencial de ahorro de costos o subvenciones. Formatea la carta con fecha, saludo, párrafos del cuerpo para cada argumento y una firma de cierre."
Salida: Una carta bien estructurada, dirigida y persuasiva.
Acción del Estudiante: Revisa la salida, puede pedir un refinamiento: "Fortalece el tercer argumento sobre ahorro de costos agregando una estadística."

Este contraste demuestra cómo aplicar un marco estructurado simple (Rol: estudiante, Tarea: escribir carta, Formato: formal con argumentos específicos) mejora dramáticamente la eficiencia y la calidad de la colaboración con la IA.

Resultados Experimentales y Descripción del Gráfico

Los resultados clave del estudio son cualitativos, capturados en las descripciones de las trayectorias. Una extensión cuantitativa hipotética podría producir un gráfico como: "Figura 1: Eficiencia de la Interacción vs. Calidad de la Salida por Trayectoria." El eje x representaría el número de turnos de prompts (inverso de la eficiencia), y el eje y representaría la puntuación de calidad del texto final (por ejemplo, evaluada mediante una rúbrica). Esperaríamos:
- El Minimalista se agruparía en el cuadrante de alta eficiencia (pocos turnos) pero baja calidad.
- El Refinador Iterativo mostraría turnos de medios a altos con calidad variable.
- El Planificador Estructurado ocuparía el cuadrante de alta eficiencia y alta calidad (pocos turnos, puntuación alta).
- El Explorador Conversacional estaría en el cuadrante de baja eficiencia (muchos turnos) con calidad variable, potencialmente alta si la exploración está enfocada. Esta visualización argumentaría poderosamente que la trayectoria del Planificador Estructurado representa el objetivo óptimo para la instrucción.

7. Aplicaciones Futuras y Direcciones

Las implicaciones de esta investigación se extienden más allá del aula de ILE:

  • Tutores de Prompting Adaptativos: Desarrollo de tutores impulsados por IA que analicen el historial de prompts de un estudiante, diagnostiquen su trayectoria y ofrezcan retroalimentación en tiempo real y con andamiaje para guiarlos hacia estrategias más efectivas (por ejemplo, "Intenta especificar tu audiencia en el próximo prompt").
  • Alfabetización Transdisciplinaria: Integrar la ingeniería de prompts en la educación STEM para la generación de código, consultas de análisis de datos y explicación científica, como defienden instituciones como la iniciativa RAISE del MIT.
  • Preparación para la Fuerza Laboral: Como se señala en informes del Foro Económico Mundial, la ingeniería de prompts se está convirtiendo rápidamente en una habilidad valorada en todas las profesiones. La educación secundaria debe preparar a los estudiantes para esta realidad.
  • Estudios Longitudinales: Seguir cómo se desarrollan las habilidades de ingeniería de prompts con el tiempo con la instrucción, y cómo se correlacionan con mejoras en las habilidades tradicionales de escritura y pensamiento crítico.
  • Prompting Multimodal: La investigación futura debe explorar la ingeniería de prompts para IA multimodal (por ejemplo, DALL-E, Sora), donde las instrucciones involucran restricciones visuales, temporales y estilísticas—una frontera de alfabetización más compleja.

8. Referencias

  1. Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
  2. Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. [Manuscrito en preparación].
  3. Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.
  4. Moor, J. (2006). The Dartmouth College Artificial Intelligence Conference: The Next Fifty Years. AI Magazine, 27(4), 87–91.
  5. MIT RAISE. (2023). Day of AI Curriculum. Massachusetts Institute of Technology. Recuperado de [https://www.dayofai.org/]
  6. World Economic Forum. (2023). Future of Jobs Report 2023.
  7. Reynolds, L., & McDonell, K. (2021). Prompt Programming for Large Language Models: Beyond the Few-Shot Paradigm. Extended Abstracts of the 2021 CHI Conference on Human Factors in Computing Systems.