Выбрать язык

Кейс-стади: Стратегии инженерии промптов у учащихся средней школы, изучающих английский как иностранный, при работе с ChatGPT для выполнения письменных заданий

Анализ кейс-стади о том, как учащиеся средней школы, изучающие английский как иностранный, используют и осваивают инженерию промптов с ChatGPT для выполнения письменных заданий, выделяя различные стратегии и педагогические выводы.
learn-en.org | PDF Size: 1.0 MB
Оценка: 4.5/5
Ваша оценка
Вы уже оценили этот документ
Обложка PDF-документа - Кейс-стади: Стратегии инженерии промптов у учащихся средней школы, изучающих английский как иностранный, при работе с ChatGPT для выполнения письменных заданий

1. Введение

Появление передовых (SOTA) генеративных ИИ-чатботов, таких как ChatGPT, создаёт как возможности, так и вызовы для образования, особенно в области изучения языков. В данной статье исследуется, как учащиеся средней школы, изучающие английский как иностранный (EFL), в качестве начинающих пользователей занимаются инженерией промптов — навыком формулирования инструкций для ИИ — для выполнения письменного задания. Основная проблема заключается в том, что эффективное сотрудничество с ChatGPT не является интуитивным; оно требует приобретённого навыка, которого многим учащимся не хватает, что приводит к неэффективным процессам проб и ошибок. Цель данного исследования — наметить различные стратегии, которые используют учащиеся, проанализировать содержание, качество и эволюцию их промптов, чтобы информировать педагогические стратегии по интеграции AI-грамотности в класс EFL-письма.

2. Методология

В данном исследовании используется качественный подход кейс-стади. Данные были собраны из записей экранов iPad учащихся средней школы EFL в Гонконге, которые впервые использовали ChatGPT и подобные SOTA-чатботы для выполнения стандартизированного письменного задания. Анализ был сосредоточен на детальном изучении промптов, сгенерированных учащимися, их последовательностей (стратегий) и соответствующих выводов ИИ. Исследование выявило четыре различных архетипических стратегии на основе паттернов взаимодействия, сложности промптов и стратегического подхода.

3. Кейс-стади: Четыре стратегии инженерии промптов

Анализ выявил четыре основных паттерна взаимодействия, представляющих различные уровни вовлечённости и стратегического мышления.

3.1. Стратегия A: Минималист

Учащиеся, выбравшие эту стратегию, использовали очень мало, часто расплывчатых промптов (например, «Напиши эссе о загрязнении»). Они демонстрировали низкую метакогнитивную вовлечённость, принимая первый вывод ИИ с минимальными правками или уточнениями. Эта стратегия подчёркивает фундаментальное непонимание возможностей ИИ и необходимости точных инструкций.

3.2. Стратегия B: Итеративный улучшатель

Эти учащиеся начинали с базового промпта, но вовлекались в процесс последовательного уточнения. Основываясь на первоначальном выводе ИИ, они давали последующие команды, такие как «сделай длиннее», «используй более простые слова» или «добавь пример». Эта стратегия показывает зарождающееся понимание интерактивной и итеративной природы сотрудничества человека и ИИ.

3.3. Стратегия C: Структурированный планировщик

Более продвинутая стратегия, при которой учащиеся пытались структурировать задачу для ИИ с самого начала. Промпты включали такие элементы, как ролевая игра («Ты — репетитор по письму»), пошаговые инструкции («Сначала дай мне три идеи. Затем составь план для первой идеи») и явные ограничения («Напиши 150 слов в прошедшем времени»). Этот подход демонстрирует стратегическое планирование и более чёткую модель того, как «программировать» ИИ с помощью языка.

3.4. Стратегия D: Исследователь-тестировщик

Эти учащиеся использовали большое количество разнообразных, часто экспериментальных промптов. Они тестировали границы возможностей ИИ с помощью творческих, не по теме или сложных запросов, чтобы понять его функциональность, прежде чем применять его к основной задаче. Эта стратегия отражает исследовательский, технически подкованный образ мышления, но не всегда эффективно ведёт к цели задания.

4. Результаты и анализ

4.1. Паттерны качества и количества промптов

Была обнаружена чёткая корреляция между сложностью промпта и качеством конечного результата. Стратегия C (Структурированный планировщик) последовательно давала наиболее связные, соответствующие задаче и лингвистически богатые тексты. Результаты Стратегии A (Минималист) были общими и часто не соответствовали цели. Само по себе количество промптов (высокое в Стратегии D) не гарантировало качества; стратегическое качество (Стратегия C) было ключевым отличительным фактором.

Сводка по взаимодействию с промптами

  • Стратегия A (Минималист): В среднем 2-3 промпта; Низкая специфичность.
  • Стратегия B (Итеративный улучшатель): В среднем 5-8 промптов; Реактивное уточнение.
  • Стратегия C (Структурированный планировщик): В среднем 4-6 промптов; Высокий уровень предварительного планирования.
  • Стратегия D (Исследователь-тестировщик): В среднем 10+ промптов; Высокое разнообразие, смешанная релевантность.

4.2. Влияние на письменный результат

Конечные письменные работы значительно различались. Структурированные промпты приводили к результатам, которые лучше соответствовали требованиям задания, использовали более подходящую лексику и демонстрировали более чёткую организацию. Промпты минималистов приводили к текстам, которые, хотя и были грамматически правильными, не имели глубины и персонализации, напоминая общий веб-контент.

5. Обсуждение: Значение для обучения AI-грамотности

Исследование подчёркивает, что эффективное использование ChatGPT — это приобретённый навык, а не врождённая способность. Распространённость минималистских и неэффективных итеративных стратегий среди новичков указывает на критический пробел в современном образовании. Авторы выступают за явное обучение инженерии промптов, которое должно быть интегрировано в учебные программы EFL. Это позволит учащимся выйти за рамки проб и ошибок, вооружив их структурами для формулирования чётких инструкций, назначения ролей, спецификации форматов и итеративного улучшения результатов — превращая ИИ из «чёрного ящика»-оракула в инструмент для сотрудничества.

Ключевые выводы

  • Инженерия промптов — это новая форма цифровой грамотности, необходимая в эпоху ИИ.
  • Подходы учащихся к ИИ разнородны, что требует дифференцированного обучения.
  • Качество инструкции (промпта) напрямую определяет качество результата, полученного с помощью ИИ.
  • Без руководства учащиеся рискуют развить пассивные или неэффективные привычки взаимодействия с ИИ.

6. Техническая структура и анализ

С технической точки зрения, инженерия промптов взаимодействует с вероятностными функциями базовой языковой модели. Хорошо составленный промпт $P$ направляет модель $M$ на выборку из более ограниченной и желательной области её распределения вывода $D$ для данного контекста $C$. Этот процесс можно абстрактно представить как максимизацию условной вероятности желаемой выходной последовательности $O$:

$O^* = \arg\max_{O} P(O | C, P, M)$

Если расплывчатый промпт увеличивает энтропию в $D$, приводя к общим выводам, то конкретный промпт с ограничениями (роль, формат, стиль) уменьшает энтропию, направляя $M$ к более целевому $O^*$. Стратегии учащихся эффективно представляют различные подходы к манипулированию этой условной вероятностью с помощью инструкций на естественном языке.

Пример аналитической структуры

Сценарий: Учащийся хочет, чтобы ChatGPT помог написать убедительный абзац о переработке отходов.

  • Слабый промпт (Высокая энтропия): «Напиши о переработке отходов.»
    Анализ: У модели минимальные ограничения, вероятно, она сгенерирует широкий обзор в энциклопедическом стиле.
  • Сильный промпт (Низкая энтропия): «Выступай в роли защитника окружающей среды. Напиши убедительный абзац объёмом 80 слов, адресованный подросткам, убеждая их перерабатывать пластиковые бутылки. Используй прямой и срочный тон и включи одну статистику.»
    Анализ: Этот промпт определяет роль (защитник), аудиторию (подростки), цель (убедить), фокус содержания (пластиковые бутылки), длину (80 слов), тон (прямой, срочный) и элемент (статистика). Это резко сужает распределение вывода модели.

7. Будущие применения и направления исследований

Результаты открывают несколько направлений для будущей работы:

  • Адаптивные репетиторы по промптам: Разработка репетиторов на основе ИИ, которые анализируют промпт учащегося и дают обратную связь в реальном времени о том, как его улучшить (например, «Попробуй указать свою аудиторию»).
  • Лонгитюдные исследования: Отслеживание того, как навыки инженерии промптов у учащихся развиваются со временем при наличии и отсутствии формального обучения.
  • Кросс-культурные и лингвистические сравнения: Исследование того, различаются ли стратегии инженерии промптов в разных языках и культурных образовательных контекстах.
  • Интеграция с педагогикой письма: Исследование того, как структуры инженерии промптов могут быть вплетены в существующие модели процесса письма (предварительное написание, черновик, редактирование).
  • Этические и критические аспекты: Расширение AI-грамотности за пределы эффективности, включив критическую оценку выводов ИИ, обнаружение смещений и этичное использование.

8. Список литературы

  1. Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. Manuscript in preparation.
  2. Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
  3. Long, D., & Magerko, B. (2020). What is AI Literacy? Competencies and Design Considerations. Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems, 1–16.
  4. OpenAI. (2023). GPT-4 Technical Report. arXiv preprint arXiv:2303.08774.
  5. Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.
  6. The Stanford Center for AI Safety. (n.d.). AI Literacy. Retrieved from https://aisafety.stanford.edu/ai-literacy

Взгляд аналитика: Деконструкция императива инженерии промптов

Ключевая идея: Это исследование не только об учащихся и ChatGPT; это микрокосм фундаментальной проблемы взаимодействия человека и ИИ в эпоху после ChatGPT. Ключевая идея заключается в том, что «промптинг — это новое программирование». Четыре стратегии (Минималист, Итеративный улучшатель, Структурированный планировщик, Исследователь-тестировщик) — это не просто стили обучения; это прототипы архетипов пользователей, которые будут определять разрыв в продуктивности и креативности в рабочей силе, усиленной ИИ. В статье правильно отмечено, что без структурированного образования большинство пользователей по умолчанию выберут неэффективные стратегии Минималиста или проб и ошибок (Итеративный улучшатель), оставляя огромный потенциал таких инструментов, как GPT-4, подробно описанный в его техническом отчёте, неиспользованным.

Логика и сильные стороны: Сила статьи заключается в её обоснованном, эмпирическом подходе. Используя записи экранов, она фиксирует сырую, нефильтрованную борьбу новичка. Это выводит дискурс за рамки теоретических структур AI-грамотности (таких как у Long & Magerko) в наблюдаемую практику. Идентификация Структурированного планировщика как высокоэффективной стратегии имеет решающее значение. Это подтверждает отраслевую гипотезу о том, что эффективный промптинг напоминает спецификацию — чёткую, ограниченную и контекстуализированную. Это согласуется с исследованиями о том, как большие языковые модели (LLM) функционируют как «стохастические попугаи», управляемые условными распределениями вероятностей; точный промпт математически сужает пространство вывода, как обсуждается в комплексных обзорах, подобных обзору Zhao et al.

Недостатки и слепые пятна: Основной недостаток исследования — его ограниченный масштаб — одно задание с пользователями-новичками. Оно не показывает, может ли Исследователь-тестировщик, демонстрирующий, возможно, самую высокую внутреннюю любознательность и исследование системы, со временем стать самым опытным пользователем. Кроме того, оно обходит критическое измерение этической и критической грамотности. Учащийся может быть блестящим Структурированным планировщиком, создавая безупречное, убедительное эссе с помощью ChatGPT, но оставаться совершенно некритичным к смещениям, фактическим неточностям или отсутствию оригинальной мысли в выводе. Как подчёркивают такие учреждения, как Stanford Center for AI Safety, истинная AI-грамотность должна включать оценку, а не только генерацию.

Практические выводы: Для педагогов и политиков вывод не подлежит обсуждению: Инженерия промптов должна быть основным, оцениваемым компонентом учебных программ по цифровой грамотности, начиная с настоящего момента. Это не опционально. Исследование предоставляет план: перевести учащихся от пассивных потребителей вывода ИИ (Минималист) к активным, стратегическим руководителям (Структурированный планировщик). Планы уроков должны явно обучать структурам промптов — роль, аудитория, формат, тон, примеры (РАФТП). Для разработчиков технологий вывод заключается в том, чтобы встроить «скаффолдинг промптов» непосредственно в образовательные интерфейсы — интерактивные шаблоны, движки предложений и метакогнитивные подсказки, которые спрашивают пользователей: «Вы подумали о том, чтобы указать...?» Будущее принадлежит не тем, кто может использовать ИИ, а тем, кто может управлять им с точностью и критическим мышлением.