Кейс-стади: Стратегии инженерии промптов у школьников, изучающих английский как иностранный, при работе с ChatGPT над письменными заданиями

1. Введение

Беспрецедентная популярность ChatGPT знаменует смену парадигмы в том, как люди используют технологии в образовательных целях. В данной статье исследуется зарождающийся навык инженерии промптов у школьников, изучающих английский как иностранный. Хотя большие языковые модели, такие как ChatGPT, обладают огромным потенциалом для поддержки развития письменных навыков, их эффективность зависит от способности пользователя формулировать точные и эффективные инструкции. Это исследование фиксирует процессы проб и ошибок новичков в реальном времени, анализируя содержание, качество и эволюцию их промптов для выполнения конкретного письменного задания. Результаты выявляют различные поведенческие стратегии, подчеркивая острую необходимость структурированного обучения инженерии промптов в рамках учебных программ по английскому языку, чтобы перевести учащихся от неэффективных экспериментов к стратегическому сотрудничеству с ИИ.

2. Обзор литературы и предпосылки

2.1 Появление современных чат-ботов

Современные генеративные ИИ-чат-боты, олицетворяемые ChatGPT, представляют собой квантовый скачок по сравнению с их основанными на правилах предшественниками. Работая на основе нейросетевых языковых моделей, обученных на обширных корпусах текстов, они генерируют текст, похожий на человеческий, на основе вероятностных предсказаний, что позволяет осуществлять более гибкое и контекстно-зависимое взаимодействие (Caldarini et al., 2022). «ChatGPT» всё чаще используется как общий термин для этого класса ИИ, устанавливая новый стандарт производительности.

2.2 Инженерия промптов как ключевой навык

Инженерия промптов — это искусство и наука проектирования входных данных для направления большой языковой модели к желаемому результату. Это не просто технический навык, а форма вычислительного мышления и металингвистической осведомлённости. Эффективные промпты часто требуют ясности, контекста, ограничений и примеров (малошотовое обучение). Для неподготовленных пользователей это представляет собой значительную кривую обучения, часто характеризующуюся итеративными догадками.

2.3 ИИ в обучении английскому как иностранному

Исследования по использованию ИИ в изучении языков были сосредоточены на автоматизированной оценке письменных работ и интеллектуальных обучающих системах. Интерактивная, генеративная природа современных чат-ботов вводит новую динамику — смещая роль обучающегося от получателя обратной связи к руководителю когнитивного инструмента. Это требует новых видов грамотности, сочетающих традиционные навыки письма со стратегиями взаимодействия с ИИ.

3. Методология

3.1 Участники и сбор данных

В исследовании участвовали школьники из Гонконга, изучающие английский как иностранный, без предшествующего опыта использования современных чат-ботов. Участникам было поручено выполнить конкретное письменное задание (например, аргументативное эссе или описательный абзац) с помощью ChatGPT. Основными данными стали записи экрана iPad, фиксирующие полную последовательность промптов, ответов ChatGPT и любых правок, внесённых учащимися.

3.2 Аналитическая структура

Был использован качественный метод кейс-стади. Записи экрана были расшифрованы и закодированы по двум основным направлениям: (1) Содержание промпта (например, спецификация задачи, запросы стиля, команды на доработку) и (2) Паттерн взаимодействия (например, количество ходов, адаптация на основе вывода). Паттерны были сгруппированы для выявления различных пользовательских стратегий.

4. Результаты: Четыре стратегии инженерии промптов

Анализ записей экрана выявил четыре типичные стратегии, представляющие различные комбинации стратегического подхода и сложности промптов.

Распределение стратегий

На основе наблюдаемых паттернов в группе.

Минималист: ~35%
Итеративный улучшатель: ~30%
Структурированный планировщик: ~20%
Диалоговый исследователь: ~15%

4.1 Минималист

Эти пользователи вводят очень краткие, часто односложные промпты, повторяющие исходную инструкцию к заданию (например, «Напиши эссе об изменении климата»). Они демонстрируют низкую терпимость к итерациям; если первоначальный вывод неудовлетворителен, они, скорее всего, откажутся от инструмента или сдадут некачественный результат. Эта стратегия отражает заблуждение инструмент-как-оракул.

4.2 Итеративный улучшатель

Эта группа начинает с простого промпта, но вовлекается в линейный процесс уточнения. Основываясь на выводе ИИ, они дают последующие команды, такие как «сделай длиннее», «используй более простые слова» или «добавь больше примеров». Взаимодействие носит реактивный и инкрементный характер, демонстрируя зарождающееся понимание отзывчивости ИИ на инструкции, но не имея общего плана.

4.3 Структурированный планировщик

Небольшая часть учащихся подошла к заданию с заранее продуманной структурой. Их первоначальные промпты были комплексными, определяя формат, тон, ключевые моменты, а иногда предоставляя план (например, «Напиши 5-параграфовое эссе в поддержку возобновляемой энергии. Параграф 1: Введение. Параграф 2: Экономические выгоды... Используй официальный тон»). Эта стратегия даёт более качественные результаты за меньшее количество ходов, что указывает на продвинутое декомпозирование задачи и метакогнитивное планирование.

4.4 Диалоговый исследователь

Эти пользователи относятся к ChatGPT как к партнёру по диалогу. Вместо того чтобы просто отдавать команды, они задают метавопросы («Как я могу улучшить свой тезис?») или просят объяснений («Почему ты выбрал это слово?»). Эта стратегия сочетает помощь в письме с обучением письму, хотя может быть блуждающей и не всегда эффективно завершает основную задачу.

5. Обсуждение и выводы

5.1 Выход за рамки метода проб и ошибок

Распространённость стратегий Минималиста и Итеративного улучшателя указывает на критический пробел. Предоставленные сами себе, большинство учащихся спонтанно не развивают сложные стратегии инженерии промптов. Их процесс неэффективен и часто не использует полные возможности ИИ, потенциально закрепляя пассивные привычки обучения.

5.2 Педагогическая интеграция

Исследование выступает за явное обучение инженерии промптов в рамках занятий по письму на английском языке. Оно должно включать:

Прямое обучение: Обучение компонентам промпта (роль, задача, контекст, ограничения, примеры).
Структурированные модели: Введение таких моделей, как RTF (Роль, Задача, Формат) или CRISPE (Возможности, Роль, Инсайт, Утверждение, Личность, Эксперимент).
Критика и анализ: Оценка сгенерированных ИИ результатов для понимания причинно-следственной связи между промптом и продуктом.
Этические аспекты: Обсуждение авторства, плагиата и критической оценки контента ИИ.

Цель — воспитать учащихся как стратегических руководителей, а не пассивных потребителей текста, сгенерированного ИИ.

6. Технический анализ и структура

Ключевая идея, Логика изложения, Сильные и слабые стороны, Практические выводы

Ключевая идея: В этой статье представлена важная, часто упускаемая истина: демократизация инструментов ИИ, таких как ChatGPT, не означает автоматической демократизации компетенций. Интерфейс обманчиво прост, но когнитивная нагрузка эффективного взаимодействия высока. Реальным узким местом в «классе, дополненном ИИ», является не доступ к технологиям, а отсутствие грамотности взаимодействия. Исследование блестяще смещает фокус с вывода ИИ на ввод человека, обнажая сырую, неприукрашенную кривую обучения.

Логика изложения: Аргументация методична и убедительна. Она начинается с постановки проблемы (современные чат-боты требуют умелого промптинга), вводит пробел в знаниях (как новички на самом деле это делают?), представляет детальные эмпирические данные (четыре стратегии) и завершается решительным призывом к действию (образование должно адаптироваться). Использование кейс-стади связывает теорию с неидеальной реальностью.

Сильные и слабые стороны: Основная сила — её экологическая валидность. Использование записей экрана пользователей-новичков в контексте реальной задачи предоставляет аутентичные данные, которых часто не хватает лабораторным исследованиям. Типология четырёх стратегий интуитивна и предоставляет педагогам мощную структуру для диагностики поведения учащихся. Основной недостаток, признанный авторами, — масштаб. Это углублённое кейс-стади, а не широкий опрос. Стратегии иллюстративны, а не статистически обобщаемы. Более того, исследование фокусируется на процессе, а не на строгом измерении качества конечного письменного продукта по разным стратегиям — что является критически важным следующим шагом.

Практические выводы: Для педагогов и разработчиков учебных программ эта статья — сигнал к пробуждению. Она даёт чёткий мандат: Инженерия промптов — это ключевая грамотность XXI века, и её нужно преподавать, а не ожидать, что она появится сама собой. Школы должны разрабатывать микрозанятия, интегрирующие такие структуры, как Иерархическая модель промптов, которая переходит от базовых командных промптов ($P_{cmd}$) к сложным итеративным промптам для рассуждений ($P_{reason}$). Например, обучение студентов формуле качественного промпта: $P_{optimal} = R + T + C + E$, где $R$ — Роль, $T$ — Задача, $C$ — Ограничения, а $E$ — Примеры. EdTech-компании должны встраивать эти педагогические леса прямо в свои интерфейсы, предлагая шаблоны для создания промптов с подсказками и обратную связь, выходя за рамки пустого текстового поля.

Технические детали и математическая формулировка

С точки зрения машинного обучения, промпт пользователя $p$ служит контекстным условием для языковой модели $M$. Модель генерирует выходную последовательность $o$ на основе распределения вероятностей $P(o | p, \theta)$, где $\theta$ представляет параметры модели. Эффективный промпт снижает энтропию этого выходного распределения, направляя его к намеченной пользователем цели $t$. Задача учащегося — минимизировать расхождение между распределением возможных выводов и его целью, формализованное как минимизация $D_{KL}(P(o|p, \theta) \,||\, P(o|t))$, где $D_{KL}$ — дивергенция Кульбака-Лейблера. Новички, методом проб и ошибок, выполняют грубую, человеко-в-цикле оптимизацию $p$ для достижения этого.

Пример случая в рамках аналитической структуры

Сценарий: Ученик должен написать убедительное письмо директору школы о запуске программы переработки отходов.

Стратегия Минималиста (Неэффективная):
Промпт 1: «Напиши письмо о переработке.»
Вывод: Общее, безликое письмо.
Действие ученика: Сдаёт вывод с незначительными правками.

Стратегия Структурированного планировщика (Эффективная — с использованием модели RTF):
Промпт 1: «Выступай в роли обеспокоенного ученика 10-го класса. Напиши официальное убедительное письмо директору старшей школы. Цель — убедить его внедрить комплексную программу переработки пластика и бумаги в столовой и классах. Используй уважительный, но настойчивый тон. Включи три аргумента: 1) Влияние на окружающую среду, 2) Возможности для вовлечения/лидерства учащихся, 3) Потенциал для экономии средств или получения грантов. Оформи письмо с датой, обращением, абзацами для каждого аргумента и подписью в конце.»
Вывод: Хорошо структурированное, целенаправленное и убедительное письмо.
Действие ученика: Просматривает вывод, может попросить доработать: «Усиль третий аргумент об экономии средств, добавив статистику.»

Этот контраст демонстрирует, как применение простой структурированной модели (Роль: ученик, Задача: написать письмо, Формат: официальный с конкретными аргументами) кардинально повышает эффективность и качество сотрудничества с ИИ.

Экспериментальные результаты и описание диаграммы

Ключевые результаты исследования качественные и отражены в описаниях стратегий. Гипотетическое количественное расширение могло бы дать диаграмму типа: «Рисунок 1: Эффективность взаимодействия vs. Качество вывода по стратегиям». По оси X откладывалось бы количество ходов-промптов (обратная эффективности), а по оси Y — оценка качества конечного текста (например, по рубрике). Мы ожидали бы:
- Минималиста в квадранте высокой эффективности (мало ходов), но низкого качества.
- Итеративного улучшателя со средним-высоким количеством ходов и переменным качеством.
- Структурированного планировщика в квадранте высокой эффективности и высокого качества (мало ходов, высокая оценка).
- Диалогового исследователя в квадранте низкой эффективности (много ходов) с переменным качеством, потенциально высоким, если исследование сфокусировано. Эта визуализация убедительно доказывала бы, что стратегия Структурированного планировщика представляет собой оптимальную цель для обучения.

7. Будущие применения и направления

Выводы этого исследования выходят за рамки класса английского языка:

Адаптивные репетиторы по промптингу: Развитие ИИ-репетиторов, которые анализируют историю промптов ученика, диагностируют его стратегию и предлагают обратную связь в реальном времени с поддержкой, чтобы направлять его к более эффективным стратегиям (например, «Попробуй указать свою аудиторию в следующем промпте»).
Междисциплинарная грамотность: Интеграция инженерии промптов в STEM-образование для генерации кода, запросов анализа данных и научных объяснений, как это пропагандируется такими инициативами, как RAISE от MIT.
Подготовка кадров: Как отмечается в отчётах Всемирного экономического форума, инженерия промптов быстро становится востребованным навыком в различных профессиях. Среднее образование должно готовить учащихся к этой реальности.
Лонгитюдные исследования: Отслеживание того, как навыки инженерии промптов развиваются со временем при обучении и как они коррелируют с улучшением традиционных навыков письма и критического мышления.
Мультимодальный промптинг: Будущие исследования должны изучить инженерию промптов для мультимодального ИИ (например, DALL-E, Sora), где инструкции включают визуальные, временные и стилистические ограничения — это более сложный рубеж грамотности.

8. Список литературы

Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. [Manuscript in preparation].
Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.
Moor, J. (2006). The Dartmouth College Artificial Intelligence Conference: The Next Fifty Years. AI Magazine, 27(4), 87–91.
MIT RAISE. (2023). Day of AI Curriculum. Massachusetts Institute of Technology. Retrieved from [https://www.dayofai.org/]
World Economic Forum. (2023). Future of Jobs Report 2023.
Reynolds, L., & McDonell, K. (2021). Prompt Programming for Large Language Models: Beyond the Few-Shot Paradigm. Extended Abstracts of the 2021 CHI Conference on Human Factors in Computing Systems.