Selecionar idioma

Estudo de Caso: Percursos de Engenharia de Prompts com ChatGPT para Tarefas de Escrita entre Estudantes Secundários de EFL

Um estudo de caso que analisa como estudantes secundários de Inglês como Língua Estrangeira (EFL) usam e aprendem engenharia de prompts com o ChatGPT para completar tarefas de escrita, destacando percursos distintos e implicações educacionais.
learn-en.org | PDF Size: 1.0 MB
Avaliação: 4.5/5
Sua avaliação
Você já avaliou este documento
Capa do documento PDF - Estudo de Caso: Percursos de Engenharia de Prompts com ChatGPT para Tarefas de Escrita entre Estudantes Secundários de EFL

1. Introdução

O advento de chatbots de IA generativa de última geração (SOTA), como o ChatGPT, apresenta tanto oportunidades como desafios para a educação, particularmente na aprendizagem de línguas. Este artigo investiga como estudantes secundários de Inglês como Língua Estrangeira (EFL), enquanto utilizadores principiantes, se envolvem na engenharia de prompts—a competência de elaborar instruções para a IA—para completar uma tarefa de escrita. O problema central é que a colaboração eficaz com o ChatGPT não é intuitiva; requer uma competência aprendida que muitos estudantes não possuem, levando a processos ineficientes de tentativa e erro. Este estudo visa mapear os diversos percursos que os estudantes seguem, analisando o conteúdo, a qualidade e a evolução dos seus prompts, para informar estratégias pedagógicas para integrar a literacia de IA na sala de aula de escrita em EFL.

2. Metodologia

Esta investigação emprega uma abordagem qualitativa de estudo de caso. Os dados foram recolhidos a partir de gravações de ecrã de iPad de estudantes secundários de EFL em Hong Kong, utilizando o ChatGPT e chatbots SOTA semelhantes pela primeira vez para completar uma tarefa de escrita padronizada. A análise focou-se num exame detalhado dos prompts gerados pelos estudantes, das suas sequências (percursos) e dos respetivos resultados da IA. O estudo identificou quatro percursos arquetípicos distintos com base em padrões de interação, sofisticação dos prompts e abordagem estratégica.

3. Estudos de Caso: Quatro Percursos de Engenharia de Prompts

A análise revelou quatro padrões primários de interação, representando diferentes níveis de envolvimento e pensamento estratégico.

3.1. Percurso A: O Minimalista

Os estudantes neste percurso usaram muito poucos prompts, frequentemente vagos (ex.: "Escreve uma redação sobre poluição"). Exibiram um baixo envolvimento metacognitivo, aceitando o primeiro resultado da IA com revisão ou especificação mínima. Este percurso destaca uma falta fundamental de compreensão das capacidades da IA e da necessidade de instrução precisa.

3.2. Percurso B: O Refinador Iterativo

Estes estudantes começaram com um prompt básico, mas envolveram-se num processo de refinamento sequencial. Com base no resultado inicial da IA, emitiram comandos de seguimento como "torna-o mais longo", "usa palavras mais simples" ou "adiciona um exemplo". Este percurso mostra uma compreensão emergente da natureza interativa e iterativa da colaboração humano-IA.

3.3. Percurso C: O Planeador Estruturado

Um percurso mais avançado, onde os estudantes tentaram estruturar a tarefa para a IA desde o início. Os prompts incluíam elementos como role-playing ("És um tutor de escrita"), instruções passo a passo ("Primeiro, dá-me três ideias. Depois, faz um esboço da primeira ideia") e restrições explícitas ("Escreve 150 palavras usando o passado"). Esta abordagem demonstra planeamento estratégico e um modelo mais claro de como "programar" a IA através da linguagem.

3.4. Percurso D: O Testador Exploratório

Estes estudantes usaram um grande volume de prompts diversos, frequentemente experimentais. Testaram os limites da IA com pedidos criativos, fora do tópico ou complexos para compreender a sua funcionalidade antes de a aplicarem à tarefa principal. Este percurso reflete uma mentalidade exploratória e tecnologicamente hábil, mas pode nem sempre conduzir eficientemente ao objetivo da tarefa.

4. Resultados & Análise

4.1. Padrões de Quantidade e Qualidade dos Prompts

Foi observada uma clara correlação entre a sofisticação do prompt e a qualidade do resultado final. O Percurso C (Planeador Estruturado) produziu consistentemente os textos mais coerentes, apropriados à tarefa e linguisticamente ricos. Os resultados do Percurso A (Minimalista) foram genéricos e frequentemente fora do alvo. A quantidade de prompts por si só (elevada no Percurso D) não garantiu qualidade; a qualidade estratégica (Percurso C) foi o fator diferenciador chave.

Resumo da Interação com Prompts

  • Percurso A (Minimalista): Média de 2-3 prompts; Baixa especificidade.
  • Percurso B (Refinador Iterativo): Média de 5-8 prompts; Refinamento reativo.
  • Percurso C (Planeador Estruturado): Média de 4-6 prompts; Elevado planeamento prévio.
  • Percurso D (Testador Exploratório): Média de 10+ prompts; Elevada variedade, relevância mista.

4.2. Impacto na Produção Escrita

Os produtos escritos finais variaram significativamente. Prompts estruturados levaram a resultados que abordaram melhor os requisitos da tarefa, usaram vocabulário mais apropriado e demonstraram organização mais clara. Prompts minimalistas resultaram em textos que, embora gramaticalmente corretos, careciam de profundidade e personalização, assemelhando-se a conteúdo genérico da web.

5. Discussão: Implicações para a Educação em Literacia de IA

O estudo sublinha que usar o ChatGPT eficazmente é uma competência aprendida, não uma capacidade inata. A prevalência de percursos minimalistas e iterativos ineficientes entre principiantes sinaliza uma lacuna crítica na educação atual. Os autores defendem a integração explícita da educação em engenharia de prompts nos currículos de EFL. Isto levaria os estudantes para além do método de tentativa e erro, equipando-os com estruturas para formular instruções claras, atribuir papéis, especificar formatos e refinar iterativamente os resultados—transformando a IA de um oráculo de caixa negra numa ferramenta colaborativa.

Principais Conclusões

  • A engenharia de prompts é uma nova forma de literacia digital essencial para a era da IA.
  • As abordagens dos estudantes à IA são heterogéneas, exigindo instrução diferenciada.
  • A qualidade da instrução (prompt) dita diretamente a qualidade do resultado assistido por IA.
  • Sem orientação, os estudantes arriscam desenvolver hábitos de interação passivos ou ineficientes com a IA.

6. Enquadramento Técnico & Análise

De uma perspetiva técnica, a engenharia de prompts interage com as funções de probabilidade do modelo de linguagem subjacente. Um prompt bem elaborado $P$ guia o modelo $M$ a amostrar de uma região mais restrita e desejável da sua distribuição de resultados $D$ para um dado contexto $C$. O processo pode ser representado abstratamente como a maximização da probabilidade condicional de uma sequência de resultados desejada $O$:

$O^* = \arg\max_{O} P(O | C, P, M)$

Enquanto um prompt vago aumenta a entropia em $D$, levando a resultados genéricos, um prompt específico com restrições (papel, formato, estilo) reduz a entropia, direcionando $M$ para um $O^*$ mais focado. Os percursos dos estudantes representam efetivamente diferentes estratégias para manipular esta probabilidade condicional através de instruções em linguagem natural.

Exemplo de Enquadramento de Análise

Cenário: Um estudante quer que o ChatGPT ajude a escrever um parágrafo persuasivo sobre reciclagem.

  • Prompt Fraco (Alta Entropia): "Escreve sobre reciclagem."
    Análise: O modelo tem restrições mínimas, provavelmente gerando uma visão geral ampla, estilo enciclopédia.
  • Prompt Forte (Baixa Entropia): "Age como um defensor do ambiente. Escreve um parágrafo persuasivo de 80 palavras dirigido a adolescentes, convencendo-os a reciclar garrafas de plástico. Usa um tom direto e urgente, e inclui uma estatística."
    Análise: Este prompt especifica o papel (defensor), o público-alvo (adolescentes), o objetivo (persuadir), o foco do conteúdo (garrafas de plástico), a extensão (80 palavras), o tom (direto, urgente) e um elemento (estatística). Reduz drasticamente a distribuição de resultados do modelo.

7. Aplicações Futuras & Direções de Investigação

As descobertas abrem várias vias para trabalhos futuros:

  • Tutores de Prompting Adaptativos: Desenvolvimento de tutores alimentados por IA que analisam o prompt de um estudante e fornecem feedback em tempo real sobre como melhorá-lo (ex.: "Tenta especificar o teu público-alvo").
  • Estudos Longitudinais: Acompanhar como as competências de engenharia de prompts dos estudantes evoluem ao longo do tempo, com e sem instrução formal.
  • Comparações Interculturais & Linguísticas: Investigar se as estratégias de engenharia de prompts diferem entre línguas e contextos educativos culturais.
  • Integração com a Pedagogia da Escrita: Investigação sobre como os enquadramentos de engenharia de prompts podem ser integrados nos modelos existentes do processo de escrita (pré-escrita, rascunho, revisão).
  • Dimensões Éticas & Críticas: Expandir a literacia de IA para além da eficiência, incluindo a avaliação crítica dos resultados da IA, deteção de preconceitos e uso ético.

8. Referências

  1. Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. Manuscrito em preparação.
  2. Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
  3. Long, D., & Magerko, B. (2020). What is AI Literacy? Competencies and Design Considerations. Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems, 1–16.
  4. OpenAI. (2023). GPT-4 Technical Report. arXiv preprint arXiv:2303.08774.
  5. Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.
  6. The Stanford Center for AI Safety. (n.d.). AI Literacy. Obtido de https://aisafety.stanford.edu/ai-literacy

Perspetiva do Analista: Desconstruindo o Imperativo da Engenharia de Prompts

Conclusão Central: Este estudo não é apenas sobre estudantes e o ChatGPT; é um microcosmo do desafio fundamental de interação humano-IA na era pós-ChatGPT. A conclusão central é que "prompting" é a nova programação. Os quatro percursos (Minimalista, Refinador Iterativo, Planeador Estruturado, Testador Exploratório) não são meramente estilos de aprendizagem; são protótipos de arquétipos de utilizador que definirão lacunas de produtividade e criatividade na força de trabalho aumentada por IA. O artigo identifica corretamente que, sem educação estruturada, a maioria dos utilizadores recairá nos percursos ineficientes de Minimalista ou de tentativa e erro do Refinador Iterativo, deixando vasto potencial de ferramentas como o GPT-4, conforme detalhado no seu relatório técnico, por explorar.

Fluxo Lógico & Pontos Fortes: O ponto forte do artigo reside na sua abordagem empírica e fundamentada. Ao usar gravações de ecrã, captura a luta crua e não filtrada do principiante. Isto move o discurso para além dos enquadramentos teóricos da literacia de IA (como os de Long & Magerko) para a prática observável. A identificação do Planeador Estruturado como o percurso de alto desempenho é crucial. Valida a hipótese da indústria de que um prompting eficaz se assemelha a um documento de especificação—claro, restrito e contextualizado. Isto alinha-se com a investigação sobre como os grandes modelos de linguagem (LLMs) funcionam como "papagaios estocásticos" guiados por distribuições de probabilidade condicional; um prompt preciso reduz matematicamente o espaço de resultados, conforme discutido em estudos abrangentes como o de Zhao et al.

Falhas & Pontos Cegos: A falha primária do estudo é o seu âmbito limitado—uma única tarefa com utilizadores pela primeira vez. Não mostra se o Testador Exploratório, que demonstra arguably a maior curiosidade intrínseca e exploração do sistema, poderá desenvolver-se no utilizador mais proficiente ao longo do tempo. Além disso, contorna a dimensão crítica da literacia ética e crítica. Um estudante pode ser um Planeador Estruturado brilhante, produzindo uma redação persuasiva impecável com o ChatGPT, mas permanecer completamente acrítico em relação aos preconceitos, imprecisões factuais ou falta de pensamento original no resultado. Como instituições como o Stanford Center for AI Safety enfatizam, a verdadeira literacia de IA deve abranger a avaliação, não apenas a geração.

Conclusões Acionáveis: Para educadores e decisores políticos, a conclusão é não negociável: A engenharia de prompts deve ser um componente central e avaliado dos currículos de literacia digital, começando agora. Isto não é opcional. O estudo fornece um plano: mover os estudantes de consumidores passivos do resultado da IA (Minimalista) para diretores ativos e estratégicos (Planeador Estruturado). Os planos de aula devem ensinar explicitamente enquadramentos de prompts—papel, público-alvo, formato, tom, exemplos (RAFTE). Para os desenvolvedores de tecnologia, a conclusão é construir "andaimes de prompt" diretamente nas interfaces educativas—modelos interativos, motores de sugestão e prompts metacognitivos que perguntem aos utilizadores: "Já consideraste especificar...?" O futuro pertence não àqueles que conseguem usar a IA, mas àqueles que a conseguem comandar com precisão e criticidade.