Estudio de Caso: Trayectorias de Ingeniería de Prompts con ChatGPT para Tareas de Escritura en Estudiantes de Secundaria de Inglés como Lengua Extranjera

Tabla de Contenidos

1. Introducción

La llegada de chatbots de IA generativa de última generación (SOTA) como ChatGPT ha creado un cambio de paradigma en el aprendizaje de idiomas y el apoyo a la escritura. A diferencia de sus predecesores basados en reglas, estos modelos, construidos sobre arquitecturas de redes neuronales como el Transformer, pueden generar texto coherente y contextualmente relevante. Para los estudiantes de Inglés como Lengua Extranjera (ILE), esto presenta una herramienta poderosa, pero compleja. El desafío central identificado en este estudio es la ingeniería de prompts—la habilidad de redactar instrucciones efectivas para obtener los resultados deseados de la IA. Sin esta habilidad, los usuarios, especialmente los estudiantes no técnicos, quedan relegados a un frustrante proceso de ensayo y error, limitando el potencial pedagógico de la herramienta.

Este artículo investiga los comportamientos incipientes de ingeniería de prompts de estudiantes de secundaria de ILE que utilizan ChatGPT por primera vez para completar una tarea de escritura. Va más allá de la discusión teórica para presentar estudios de caso empíricos y cualitativos que mapean distintas trayectorias de usuario.

2. Metodología y Recopilación de Datos

La investigación emplea un enfoque de estudio de caso cualitativo, analizando datos de interacción del mundo real de usuarios novatos.

2.1. Participantes y Tarea

Los participantes fueron estudiantes de secundaria de ILE sin experiencia formal previa en el uso de chatbots SOTA como ChatGPT. El estudio capturó su proceso mediante grabaciones de pantalla de iPad mientras interactuaban con la IA para completar una tarea de escritura definida. Esta metodología proporciona una visión cruda y sin filtros del proceso de colaboración humano-IA.

2.2. Marco de Análisis de Datos

Las grabaciones de pantalla se transcribieron y analizaron para codificar:

Contenido del Prompt: Los componentes lingüísticos e instructivos de cada consulta del estudiante (por ejemplo, descripción de la tarea, solicitudes de estilo, restricciones).
Cantidad de Prompts: El número de prompts utilizados para completar la tarea.
Patrón de Interacción: La secuencia y naturaleza de los prompts de seguimiento basados en las respuestas de la IA.
Calidad del Resultado: La idoneidad del texto final generado por la IA para la tarea asignada.

A partir de este análisis, se identificaron cuatro trayectorias de usuario arquetípicas que se desarrollaron en estudios de caso detallados.

3. Estudios de Caso: Cuatro Trayectorias de Ingeniería de Prompts

El análisis cristalizó cuatro patrones de comportamiento distintos, que representan un espectro de sofisticación en la ingeniería de prompts.

3.1. Trayectoria A: El Minimalista

Este estudiante utilizó un número muy bajo de prompts (por ejemplo, 1-2). El prompt inicial era a menudo una traducción simple y directa de la instrucción de la tarea (por ejemplo, "Escribe un ensayo sobre el cambio climático"). Mostró un compromiso mínimo con la salida de la IA, aceptando el primer resultado con poca o ninguna refinación. Esta trayectoria destaca un concepto erróneo de herramienta-como-oráculo, donde la IA es vista como la proveedora de una respuesta completa y final, en lugar de un socio colaborativo.

3.2. Trayectoria B: El Refinador Iterativo

Este estudiante utilizó un número moderado de prompts en una secuencia lineal e iterativa. Comenzó con un prompt básico, revisó la salida y emitió comandos de seguimiento para mejoras específicas (por ejemplo, "Hazlo más largo", "Usa palabras más simples"). Esta trayectoria demuestra una comprensión emergente de la capacidad de respuesta de la IA a las instrucciones, pero permanece dentro de un marco básico de solicitud de revisión.

3.3. Trayectoria C: El Indagador Estructurado

Este estudiante empleó un mayor número de prompts con un enfoque estratégico y de múltiples etapas. Podría primero pedirle a la IA que "genere tres ideas para un ensayo sobre X", luego seleccionar una, luego pedir un esquema y finalmente solicitar un borrador basado en ese esquema. Esta trayectoria refleja una estrategia metacognitiva más sofisticada, desglosando el proceso de escritura y utilizando la IA para obtener apoyo estructurado en cada etapa.

3.4. Trayectoria D: El Explorador por Ensayo y Error

Este estudiante utilizó un gran volumen de prompts con una variación significativa pero con poca estrategia aparente. Los prompts cambiaban drásticamente en enfoque y estilo (por ejemplo, de formal a coloquial, de amplio a estrecho) sin una progresión clara. Esta trayectoria encarna la experimentación no estructurada que caracteriza la experiencia del novato, lo que a menudo resulta en confusión y un uso ineficiente del tiempo, aunque ocasionalmente puede producir resultados creativos.

4. Hallazgos Clave y Análisis

4.1. Patrones de Calidad y Cantidad de Prompts

El estudio no encontró una correlación simple entre el número de prompts y la calidad de la salida final. La Trayectoria C (Indagador Estructurado) a menudo producía el texto más apropiado para la tarea, no necesariamente a través de la mayor cantidad de prompts, sino a través de los prompts más estratégicos y de mayor calidad. La calidad se definió por la especificidad, la provisión de contexto y la descomposición de la tarea. Un solo prompt bien diseñado (por ejemplo, "Escribe un ensayo persuasivo de 300 palabras para una revista escolar argumentando a favor de más contenedores de reciclaje en el campus, usando dos estadísticas y una llamada a la acción") podría superar a una docena de prompts vagos.

Resumen de la Interacción

Trayectoria C (Estructurada) produjo consistentemente los borradores finales mejor calificados por evaluadores independientes, a pesar de no usar siempre la mayor cantidad de turnos. Trayectoria D (Ensayo y Error) tuvo la mayor variación en la calidad de los resultados.

4.2. El Papel de la Alfabetización en IA

Las trayectorias ilustran claramente diferentes niveles de alfabetización en IA implícita. Los estudiantes de las Trayectorias A y D carecían de un modelo mental funcional de cómo ChatGPT procesa las solicitudes. En contraste, los estudiantes de las Trayectorias B y C demostraron una comprensión incipiente de la IA como un sistema estocástico que sigue instrucciones. Intuitivamente comprendieron que entradas más claras y estructuradas conducen a salidas más predecibles y útiles. Este hallazgo apoya directamente los llamados de organizaciones como la International Society for Technology in Education (ISTE) para integrar los fundamentos de la alfabetización en IA en los currículos de K-12.

5. Marco Técnico y Análisis

Comprender estas trayectorias requiere una lente técnica. ChatGPT y modelos similares se basan en la arquitectura Transformer y son fundamentalmente predictores del siguiente token. La probabilidad de generar una secuencia de salida específica $O$ dado un prompt de entrada $P$ se modela como: $$P(O|P) = \prod_{t=1}^{|O|} P(o_t | P, o_1, ..., o_{t-1})$$ donde $o_t$ es el token en la posición $t$. El prompt $P$ de un estudiante establece el contexto inicial y la distribución de probabilidad para la salida.

Ejemplo del Marco de Análisis: Podemos modelar una sesión de ingeniería de prompts de un estudiante como una máquina de estados. Sea el Estado (S) la ventana de contexto actual de la conversación (los últimos $k$ tokens). La Acción (A) es el siguiente prompt del estudiante. La Recompensa (R) es la utilidad percibida de la respuesta de la IA (por ejemplo, una puntuación subjetiva del 1 al 5). El objetivo del estudiante es aprender una política $\pi$ que mapee estados a acciones para maximizar la recompensa acumulada. Las cuatro trayectorias representan diferentes, y a menudo subóptimas, políticas de exploración para este problema de aprendizaje por refuerzo que enfrenta el usuario humano.

Descripción del Gráfico: Un gráfico conceptual trazaría la Especificidad del Prompt (Eje X) frente a la Descomposición de la Tarea (Eje Y). La Trayectoria A (Minimalista) se agruparía en el cuadrante bajo-bajo. La Trayectoria D (Ensayo y Error) mostraría una nube dispersa en todo el gráfico. La Trayectoria B (Refinador Iterativo) mostraría un movimiento horizontal hacia la derecha (aumentando la especificidad). La Trayectoria C (Indagador Estructurado) ocuparía el cuadrante alto-alto, demostrando tanto alta especificidad como alto uso de la descomposición de tareas en sus prompts.

6. Implicaciones Educativas y Direcciones Futuras

Implicación Central: Dejar que los estudiantes descubran la ingeniería de prompts mediante ensayo y error es pedagógicamente ineficiente y desigual. Favorece a los estudiantes que desarrollan naturalmente el pensamiento estratégico (Trayectoria C) y perjudica a otros.

Estrategia Accionable: La instrucción explícita y escalonada en ingeniería de prompts debe integrarse en la pedagogía de la escritura en ILE. Esto incluye:

Enseñar el marco de prompts "Rol-Objetivo-Formato-Restricciones".
Demostrar el refinamiento iterativo (por ejemplo, usar estratégicamente las funciones "regenerar" o "continuar" de ChatGPT).
Evaluar críticamente las salidas de la IA en cuanto a sesgo, precisión y estilo.

Investigación y Desarrollo Futuros:

Interfaces de Aprendizaje Adaptativo: Los futuros asistentes de escritura con IA podrían detectar la trayectoria de un usuario (por ejemplo, detectando prompts minimalistas) y ofrecer sugerencias contextuales o tutoriales para guiarlos hacia estrategias más efectivas.
Bibliotecas y Plantillas de Prompts: Desarrollar plantillas de prompts curadas y apropiadas para el nivel, para tareas comunes de escritura en ILE (por ejemplo, "generador de ensayos de comparación y contraste").
Estudios Longitudinales: Seguir cómo evolucionan las trayectorias de ingeniería de prompts de los estudiantes con la instrucción y la experiencia a lo largo del tiempo.
Estudios Interlingüísticos y Culturales: Investigar si las estrategias de ingeniería de prompts difieren significativamente entre idiomas y culturas educativas.

7. Referencias

Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. Manuscrito en preparación.
Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
Long, D., & Magerko, B. (2020). What is AI Literacy? Competencies and Design Considerations. Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems, 1–16.
Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30 (NIPS 2017).
International Society for Technology in Education (ISTE). (2023). AI Explorations for Educators. Recuperado de iste.org.
Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.

8. Perspectiva del Analista: Deconstruyendo el Baile de Escritura Humano-IA

Perspicacia Central: Este estudio no trata realmente sobre ChatGPT; es una revelación cruda del humano no preparado en el bucle de retroalimentación humano-IA. La herramienta es exponencialmente más capaz que la habilidad del usuario para dirigirla. Las cuatro trayectorias no son solo comportamientos; son marcadores diagnósticos para una nueva forma de analfabetismo digital. La verdadera brecha de producto no es un mejor LLM, sino una mejor capa de interfaz humana que enseñe la estrategia de interacción en tiempo real.

Flujo Lógico: El artículo identifica correctamente el problema (el ensayo y error es el predeterminado) y proporciona evidencia empírica elegante a través de la taxonomía de trayectorias. El salto lógico que da—y esto es crucial—es que estos comportamientos de novato no son una fase temporal. Sin intervención, las trayectorias del Minimalista y del Explorador por Ensayo y Error pueden solidificarse en patrones de uso subóptimos permanentes, cementando una asimetría de poder donde el usuario es guiado por los valores predeterminados de la herramienta en lugar de dirigirla. Esto se alinea con preocupaciones más amplias en la investigación de HCI, como las discutidas en trabajos sobre "sesgo de automatización" y "deterioro de habilidades" en sistemas altamente asistidos.

Fortalezas y Debilidades: La fortaleza es su metodología observacional fundamentada. Las grabaciones de pantalla no mienten. La debilidad principal, reconocida implícitamente, es la escala. Cuatro trayectorias de una muestra limitada son arquetipos convincentes, no categorías definitivas. El estudio también elude el elefante en la habitación: la evaluación. Si un Minimalista obtiene una calificación aprobatoria de un maestro sobrecargado usando un ensayo generado por IA, ¿qué incentivo tiene para aprender ingeniería de prompts? Las recomendaciones educativas del artículo dependen de un sistema que valora el proceso sobre el producto, algo que la mayoría de los marcos de evaluación educativa actuales no hacen.

Perspectivas Accionables: Para inversores y desarrolladores de EdTech, la conclusión es clara: la próxima ola de creación de valor está en el andamiaje de la ingeniería de prompts. Piensen en un Grammarly para prompts—una superposición que analiza el comando vago inicial de un estudiante y sugiere, "Intenta agregar un público objetivo y un recuento de palabras. Haz clic aquí para ver un ejemplo". Para los administradores escolares, el mandato es financiar el desarrollo profesional no solo en el uso de la IA, sino en enseñar la pedagogía de la interacción con la IA. Este estudio proporciona la evidencia perfecta para argumentar a favor de esa partida presupuestaria. Finalmente, para los investigadores, el marco de trayectorias es una lente replicable. Aplíquenlo a profesionales que usan IA para programación (GitHub Copilot), diseño o investigación legal. Predigo que encontrarán los mismos cuatro arquetipos, demostrando que este es un desafío fundamental de interacción humano-computadora, no solo un problema de ILE.