1. Introdução

A popularidade sem precedentes do ChatGPT assinala uma mudança de paradigma na forma como os indivíduos interagem com a tecnologia para fins educativos. Este artigo investiga a competência emergente da engenharia de prompts entre estudantes do ensino secundário de Inglês como Língua Estrangeira (EFL). Embora os Modelos de Linguagem de Grande Escala (LLMs) como o ChatGPT ofereçam um potencial imenso para apoiar o desenvolvimento da escrita, a sua eficácia está condicionada pela capacidade do utilizador de formular instruções precisas e eficazes. Este estudo captura os processos em tempo real de tentativa e erro de utilizadores novatos, analisando o conteúdo, a qualidade e a evolução dos seus prompts para completar uma tarefa de escrita definida. Os resultados revelam trajetórias comportamentais distintas, sublinhando a necessidade urgente de uma educação estruturada em engenharia de prompts nos currículos de EFL para levar os estudantes de uma experimentação ineficiente para uma colaboração estratégica com a IA.

2. Revisão da Literatura & Contexto

2.1 A Ascensão dos Chatbots de Última Geração

Os chatbots de IA generativa de última geração (State-of-the-Art, SOTA), personificados pelo ChatGPT, representam um salto quântico em relação aos seus antecessores baseados em regras. Alimentados por modelos de linguagem de redes neurais treinados em vastos corpora, geram texto semelhante ao humano com base em previsões probabilísticas, permitindo interações mais flexíveis e contextualmente conscientes (Caldarini et al., 2022). "ChatGPT" é cada vez mais usado como um termo genérico para esta classe de IA, estabelecendo um novo padrão de desempenho.

2.2 A Engenharia de Prompts como uma Competência Crítica

A engenharia de prompts é a arte e ciência de conceber entradas para orientar um LLM na direção de uma saída desejada. Não é apenas uma competência técnica, mas uma forma de pensamento computacional e consciência metalinguística. Prompts eficazes requerem frequentemente clareza, contexto, restrições e exemplos (aprendizagem com poucos exemplos). Para utilizadores não técnicos, isto representa uma curva de aprendizagem significativa, muitas vezes caracterizada por tentativas iterativas.

2.3 IA na Educação de EFL

A investigação sobre IA na aprendizagem de línguas tem-se centrado na avaliação automática da escrita (AWE) e em sistemas de tutoria inteligente. A natureza interativa e generativa dos chatbots SOTA introduz uma nova dinâmica—mudando o papel do aprendiz de recetor de feedback para diretor de uma ferramenta cognitiva. Isto exige novas literacias, combinando competências tradicionais de escrita com estratégias de interação com a IA.

3. Metodologia

3.1 Participantes & Recolha de Dados

O estudo envolveu estudantes do ensino secundário de EFL em Hong Kong sem experiência prévia na utilização de chatbots SOTA. Foi solicitado aos participantes que completassem uma tarefa de escrita específica (por exemplo, um ensaio argumentativo ou um parágrafo descritivo) utilizando o ChatGPT. Os dados primários consistiram em gravações de ecrã de iPad, capturando a sequência completa de prompts, as respostas do ChatGPT e quaisquer revisões feitas pelos estudantes.

3.2 Quadro Analítico

Foi utilizada uma abordagem de estudo de caso qualitativo. As gravações de ecrã foram transcritas e codificadas ao longo de duas dimensões principais: (1) Conteúdo do Prompt (por exemplo, especificação da tarefa, pedidos de estilo, comandos de revisão) e (2) Padrão de Interação (por exemplo, número de turnos, adaptação com base na saída). Os padrões foram agrupados para identificar trajetórias de utilizador distintas.

4. Resultados: Quatro Trajetórias de Engenharia de Prompts

A análise das gravações de ecrã revelou quatro trajetórias prototípicas, representando diferentes combinações de abordagem estratégica e sofisticação dos prompts.

Distribuição das Trajetórias

Com base nos padrões observados na coorte.

  • O Minimalista: ~35%
  • O Refinador Iterativo: ~30%
  • O Planeador Estruturado: ~20%
  • O Explorador Conversacional: ~15%

4.1 O Minimalista

Estes utilizadores introduzem prompts muito breves, frequentemente de uma só frase, que espelham a instrução da tarefa original (por exemplo, "Escreve um ensaio sobre as alterações climáticas"). Exibem uma baixa tolerância para a iteração; se a saída inicial for insatisfatória, é provável que abandonem a ferramenta ou submetam o resultado medíocre. Esta trajetória reflete um equívoco de ferramenta-como-oráculo.

4.2 O Refinador Iterativo

Este grupo começa com um prompt simples, mas envolve-se num processo de refinamento linear. Com base na saída da IA, emitem comandos de seguimento como "torna-o mais longo", "usa palavras mais simples" ou "adiciona mais exemplos". A interação é reativa e incremental, demonstrando uma compreensão emergente da capacidade de resposta da IA à instrução, mas carecendo de um plano global.

4.3 O Planeador Estruturado

Uma minoria de estudantes abordou a tarefa com uma estrutura premeditada. Os seus prompts iniciais eram abrangentes, especificando formato, tom, pontos-chave e, por vezes, fornecendo um esboço (por exemplo, "Escreve um ensaio de 5 parágrafos a argumentar a favor das energias renováveis. Parágrafo 1: Introdução. Parágrafo 2: Benefícios económicos... Usa um tom formal."). Esta trajetória produz saídas de maior qualidade com menos turnos, indicando uma decomposição de tarefas e um planeamento metacognitivo avançados.

4.4 O Explorador Conversacional

Estes utilizadores tratam o ChatGPT como um parceiro de diálogo. Em vez de apenas emitirem comandos, fazem meta-perguntas ("Como posso melhorar a minha tese?") ou pedem explicações ("Porque escolheste esta palavra?"). Esta trajetória mistura assistência à escrita com aprendizagem sobre escrita, embora possa divagar e não completar eficientemente a tarefa principal.

5. Discussão & Implicações

5.1 Ir Além da Tentativa e Erro

A prevalência das trajetórias do Minimalista e do Refinador Iterativo destaca uma lacuna crítica. Deixados à sua sorte, a maioria dos estudantes não desenvolve espontaneamente estratégias sofisticadas de engenharia de prompts. O seu processo é ineficiente e muitas vezes não aproveita todas as capacidades da IA, podendo reforçar hábitos de aprendizagem passivos.

5.2 Integração Pedagógica

O estudo defende uma educação explícita em engenharia de prompts na sala de aula de escrita de EFL. Esta deve incluir:

  • Instrução Direta: Ensinar os componentes de um prompt (papel, tarefa, contexto, restrições, exemplos).
  • Quadros Estruturados: Introduzir modelos como RTF (Papel, Tarefa, Formato) ou CRISPE (Capacidade, Papel, Perspetiva, Declaração, Personalidade, Experiência).
  • Crítica e Análise: Avaliar as saídas geradas pela IA para compreender a relação de causa e efeito entre o prompt e o produto.
  • Considerações Éticas: Discutir autoria, plágio e avaliação crítica do conteúdo de IA.

O objetivo é cultivar estudantes que sejam diretores estratégicos e não consumidores passivos de texto gerado por IA.

6. Análise Técnica & Quadro Conceptual

Ideia Central, Fluxo Lógico, Pontos Fortes & Fracos, Ideias Acionáveis

Ideia Central: Este artigo transmite uma verdade crucial e frequentemente ignorada: a democratização de ferramentas de IA como o ChatGPT não democratiza automaticamente a competência. A interface é enganadoramente simples, mas a carga cognitiva de uma interação eficaz é elevada. O verdadeiro estrangulamento na "sala de aula aumentada por IA" não é o acesso à tecnologia; é a falta de literacia de interação. O estudo desloca brilhantemente o foco da saída da IA para a entrada do humano, expondo a curva de aprendizagem crua e sem adornos.

Fluxo Lógico: O argumento é metódico e convincente. Começa por estabelecer o problema (os chatbots SOTA requerem prompts habilidosos), introduz a lacuna de conhecimento (como é que os novatos realmente o fazem?), apresenta evidência empírica granular (as quatro trajetórias) e conclui com um apelo veemente à ação (a educação deve adaptar-se). O uso de estudos de caso fundamenta a teoria na realidade complexa.

Pontos Fortes & Fracos: O principal ponto forte é a sua validade ecológica. A utilização de gravações de ecrã de utilizadores pela primeira vez num contexto de tarefa real fornece dados autênticos que os estudos de laboratório frequentemente carecem. A tipologia das quatro trajetórias é intuitiva e fornece um quadro poderoso para os educadores diagnosticarem o comportamento dos estudantes. O principal ponto fraco, reconhecido pelos autores, é a escala. Este é um estudo de caso aprofundado, não um inquérito amplo. As trajetórias são ilustrativas, não estatisticamente generalizáveis. Além disso, o estudo foca-se no processo, não medindo rigorosamente a qualidade do produto escrito final entre as trajetórias—um passo crítico seguinte.

Ideias Acionáveis: Para educadores e designers curriculares, este artigo é um alerta. Fornece um mandato claro: A engenharia de prompts é uma literacia essencial do século XXI e deve ser ensinada, não adquirida por acaso. As escolas devem desenvolver micro-aulas que integrem quadros como o Modelo de Hierarquia de Prompts, que passa de prompts de comando básico ($P_{cmd}$) para prompts de raciocínio iterativo complexo ($P_{reason}$). Por exemplo, ensinar aos estudantes a fórmula para um prompt de alta qualidade: $P_{ótimo} = P + T + R + E$, onde $P$ é Papel, $T$ é Tarefa, $R$ é Restrições, e $E$ é Exemplos. As empresas de EdTech devem incorporar estes andaimes pedagógicos diretamente nas suas interfaces, oferecendo modelos guiados de construção de prompts e feedback, indo além da caixa de texto em branco.

Detalhes Técnicos & Formulação Matemática

Do ponto de vista da aprendizagem automática, o prompt $p$ de um utilizador serve como contexto de condicionamento para o modelo de linguagem $M$. O modelo gera uma sequência de saída $o$ com base na distribuição de probabilidade $P(o | p, \theta)$, onde $\theta$ representa os parâmetros do modelo. Um prompt eficaz reduz a entropia desta distribuição de saída, orientando-a para o alvo pretendido $t$ do utilizador. O desafio do estudante é minimizar a divergência entre a distribuição de saídas possíveis e o seu objetivo, formalizado como minimizar $D_{KL}(P(o|p, \theta) \,||\, P(o|t))$, onde $D_{KL}$ é a divergência de Kullback–Leibler. Os utilizadores novatos, através da tentativa e erro, estão a realizar uma otimização rudimentar, com o humano no ciclo, de $p$ para alcançar isto.

Exemplo de Caso do Quadro de Análise

Cenário: Um estudante deve escrever uma carta persuasiva ao diretor da escola sobre a criação de um programa de reciclagem.

Trajetória do Minimalista (Ineficaz):
Prompt 1: "Escreve uma carta sobre reciclagem."
Saída: Uma carta genérica e insípida.
Ação do Estudante: Submete a saída com pequenas edições.

Trajetória do Planeador Estruturado (Eficaz - Usando o Quadro RTF):
Prompt 1: "Age como um estudante do 10.º ano preocupado. Escreve uma carta persuasiva formal para o diretor de uma escola secundária. O objetivo é convencê-lo a implementar um programa abrangente de reciclagem de plástico e papel na cantina e nas salas de aula. Usa um tom respeitoso mas urgente. Inclui três argumentos: 1) Impacto ambiental, 2) Oportunidades de envolvimento/liderança dos estudantes, 3) Potencial para poupanças de custos ou subsídios. Formata a carta com data, saudação, parágrafos do corpo para cada argumento e uma assinatura de encerramento."
Saída: Uma carta bem estruturada, direcionada e persuasiva.
Ação do Estudante: Revê a saída, pode pedir um refinamento: "Torna o terceiro argumento sobre poupanças de custos mais forte, adicionando uma estatística."

Este contraste demonstra como a aplicação de um quadro estruturado simples (Papel: estudante, Tarefa: escrever carta, Formato: formal com argumentos específicos) melhora dramaticamente a eficiência e a qualidade da colaboração com a IA.

Resultados Experimentais & Descrição do Gráfico

Os resultados-chave do estudo são qualitativos, capturados nas descrições das trajetórias. Uma extensão quantitativa hipotética poderia produzir um gráfico como: "Figura 1: Eficiência da Interação vs. Qualidade da Saída por Trajetória." O eixo dos x representaria o número de turnos de prompts (inverso da eficiência), e o eixo dos y representaria a pontuação de qualidade do texto final (por exemplo, avaliada através de uma rubrica). Esperaríamos:
- O Minimalista a agrupar-se no quadrante de alta eficiência (poucos turnos) mas baixa qualidade.
- O Refinador Iterativo a mostrar turnos médios a altos com qualidade variável.
- O Planeador Estruturado a ocupar o quadrante de alta eficiência, alta qualidade (poucos turnos, pontuação alta).
- O Explorador Conversacional a estar no quadrante de baixa eficiência (muitos turnos) com qualidade variável, potencialmente alta se a exploração for focada. Esta visualização argumentaria poderosamente que a trajetória do Planeador Estruturado representa o alvo ótimo para o ensino.

7. Aplicações Futuras & Direções

As implicações desta investigação estendem-se para além da sala de aula de EFL:

  • Tutores de Prompting Adaptativos: Desenvolvimento de tutores alimentados por IA que analisam o histórico de prompts de um estudante, diagnosticam a sua trajetória e oferecem feedback em tempo real e escalonado para os guiar para estratégias mais eficazes (por exemplo, "Tenta especificar o teu público-alvo no próximo prompt").
  • Literacia Transdisciplinar: Integração da engenharia de prompts na educação STEM para geração de código, consultas de análise de dados e explicação científica, conforme defendido por instituições como a iniciativa RAISE do MIT.
  • Preparação para a Força de Trabalho: Como observado em relatórios do Fórum Económico Mundial, a engenharia de prompts está rapidamente a tornar-se uma competência valorizada em várias profissões. O ensino secundário deve preparar os estudantes para esta realidade.
  • Estudos Longitudinais: Acompanhar como as competências de engenharia de prompts se desenvolvem ao longo do tempo com instrução, e como se correlacionam com melhorias nas competências tradicionais de escrita e pensamento crítico.
  • Prompting Multimodal: A investigação futura deve explorar a engenharia de prompts para IA multimodal (por exemplo, DALL-E, Sora), onde as instruções envolvem restrições visuais, temporais e estilísticas—uma fronteira de literacia mais complexa.

8. Referências

  1. Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
  2. Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. [Manuscrito em preparação].
  3. Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.
  4. Moor, J. (2006). The Dartmouth College Artificial Intelligence Conference: The Next Fifty Years. AI Magazine, 27(4), 87–91.
  5. MIT RAISE. (2023). Day of AI Curriculum. Massachusetts Institute of Technology. Consultado em [https://www.dayofai.org/]
  6. World Economic Forum. (2023). Future of Jobs Report 2023.
  7. Reynolds, L., & McDonell, K. (2021). Prompt Programming for Large Language Models: Beyond the Few-Shot Paradigm. Extended Abstracts of the 2021 CHI Conference on Human Factors in Computing Systems.