1. Введение
Появление передовых (SOTA) генеративных ИИ-чатботов, таких как ChatGPT, создаёт как возможности, так и вызовы для образования, особенно в области изучения языков. В данной статье исследуется, как учащиеся средней школы, изучающие английский как иностранный (EFL), в качестве начинающих пользователей занимаются инженерией промптов — навыком формулирования инструкций для ИИ — для выполнения письменного задания. Основная проблема заключается в том, что эффективное сотрудничество с ChatGPT не является интуитивным; оно требует приобретённого навыка, которого многим учащимся не хватает, что приводит к неэффективным процессам проб и ошибок. Цель данного исследования — наметить различные стратегии, которые используют учащиеся, проанализировать содержание, качество и эволюцию их промптов, чтобы информировать педагогические стратегии по интеграции AI-грамотности в класс EFL-письма.
2. Методология
В данном исследовании используется качественный подход кейс-стади. Данные были собраны из записей экранов iPad учащихся средней школы EFL в Гонконге, которые впервые использовали ChatGPT и подобные SOTA-чатботы для выполнения стандартизированного письменного задания. Анализ был сосредоточен на детальном изучении промптов, сгенерированных учащимися, их последовательностей (стратегий) и соответствующих выводов ИИ. Исследование выявило четыре различных архетипических стратегии на основе паттернов взаимодействия, сложности промптов и стратегического подхода.
3. Кейс-стади: Четыре стратегии инженерии промптов
Анализ выявил четыре основных паттерна взаимодействия, представляющих различные уровни вовлечённости и стратегического мышления.
3.1. Стратегия A: Минималист
Учащиеся, выбравшие эту стратегию, использовали очень мало, часто расплывчатых промптов (например, «Напиши эссе о загрязнении»). Они демонстрировали низкую метакогнитивную вовлечённость, принимая первый вывод ИИ с минимальными правками или уточнениями. Эта стратегия подчёркивает фундаментальное непонимание возможностей ИИ и необходимости точных инструкций.
3.2. Стратегия B: Итеративный улучшатель
Эти учащиеся начинали с базового промпта, но вовлекались в процесс последовательного уточнения. Основываясь на первоначальном выводе ИИ, они давали последующие команды, такие как «сделай длиннее», «используй более простые слова» или «добавь пример». Эта стратегия показывает зарождающееся понимание интерактивной и итеративной природы сотрудничества человека и ИИ.
3.3. Стратегия C: Структурированный планировщик
Более продвинутая стратегия, при которой учащиеся пытались структурировать задачу для ИИ с самого начала. Промпты включали такие элементы, как ролевая игра («Ты — репетитор по письму»), пошаговые инструкции («Сначала дай мне три идеи. Затем составь план для первой идеи») и явные ограничения («Напиши 150 слов в прошедшем времени»). Этот подход демонстрирует стратегическое планирование и более чёткую модель того, как «программировать» ИИ с помощью языка.
3.4. Стратегия D: Исследователь-тестировщик
Эти учащиеся использовали большое количество разнообразных, часто экспериментальных промптов. Они тестировали границы возможностей ИИ с помощью творческих, не по теме или сложных запросов, чтобы понять его функциональность, прежде чем применять его к основной задаче. Эта стратегия отражает исследовательский, технически подкованный образ мышления, но не всегда эффективно ведёт к цели задания.
4. Результаты и анализ
4.1. Паттерны качества и количества промптов
Была обнаружена чёткая корреляция между сложностью промпта и качеством конечного результата. Стратегия C (Структурированный планировщик) последовательно давала наиболее связные, соответствующие задаче и лингвистически богатые тексты. Результаты Стратегии A (Минималист) были общими и часто не соответствовали цели. Само по себе количество промптов (высокое в Стратегии D) не гарантировало качества; стратегическое качество (Стратегия C) было ключевым отличительным фактором.
Сводка по взаимодействию с промптами
- Стратегия A (Минималист): В среднем 2-3 промпта; Низкая специфичность.
- Стратегия B (Итеративный улучшатель): В среднем 5-8 промптов; Реактивное уточнение.
- Стратегия C (Структурированный планировщик): В среднем 4-6 промптов; Высокий уровень предварительного планирования.
- Стратегия D (Исследователь-тестировщик): В среднем 10+ промптов; Высокое разнообразие, смешанная релевантность.
4.2. Влияние на письменный результат
Конечные письменные работы значительно различались. Структурированные промпты приводили к результатам, которые лучше соответствовали требованиям задания, использовали более подходящую лексику и демонстрировали более чёткую организацию. Промпты минималистов приводили к текстам, которые, хотя и были грамматически правильными, не имели глубины и персонализации, напоминая общий веб-контент.
5. Обсуждение: Значение для обучения AI-грамотности
Исследование подчёркивает, что эффективное использование ChatGPT — это приобретённый навык, а не врождённая способность. Распространённость минималистских и неэффективных итеративных стратегий среди новичков указывает на критический пробел в современном образовании. Авторы выступают за явное обучение инженерии промптов, которое должно быть интегрировано в учебные программы EFL. Это позволит учащимся выйти за рамки проб и ошибок, вооружив их структурами для формулирования чётких инструкций, назначения ролей, спецификации форматов и итеративного улучшения результатов — превращая ИИ из «чёрного ящика»-оракула в инструмент для сотрудничества.
Ключевые выводы
- Инженерия промптов — это новая форма цифровой грамотности, необходимая в эпоху ИИ.
- Подходы учащихся к ИИ разнородны, что требует дифференцированного обучения.
- Качество инструкции (промпта) напрямую определяет качество результата, полученного с помощью ИИ.
- Без руководства учащиеся рискуют развить пассивные или неэффективные привычки взаимодействия с ИИ.
6. Техническая структура и анализ
С технической точки зрения, инженерия промптов взаимодействует с вероятностными функциями базовой языковой модели. Хорошо составленный промпт $P$ направляет модель $M$ на выборку из более ограниченной и желательной области её распределения вывода $D$ для данного контекста $C$. Этот процесс можно абстрактно представить как максимизацию условной вероятности желаемой выходной последовательности $O$:
$O^* = \arg\max_{O} P(O | C, P, M)$
Если расплывчатый промпт увеличивает энтропию в $D$, приводя к общим выводам, то конкретный промпт с ограничениями (роль, формат, стиль) уменьшает энтропию, направляя $M$ к более целевому $O^*$. Стратегии учащихся эффективно представляют различные подходы к манипулированию этой условной вероятностью с помощью инструкций на естественном языке.
Пример аналитической структуры
Сценарий: Учащийся хочет, чтобы ChatGPT помог написать убедительный абзац о переработке отходов.
- Слабый промпт (Высокая энтропия): «Напиши о переработке отходов.»
Анализ: У модели минимальные ограничения, вероятно, она сгенерирует широкий обзор в энциклопедическом стиле. - Сильный промпт (Низкая энтропия): «Выступай в роли защитника окружающей среды. Напиши убедительный абзац объёмом 80 слов, адресованный подросткам, убеждая их перерабатывать пластиковые бутылки. Используй прямой и срочный тон и включи одну статистику.»
Анализ: Этот промпт определяет роль (защитник), аудиторию (подростки), цель (убедить), фокус содержания (пластиковые бутылки), длину (80 слов), тон (прямой, срочный) и элемент (статистика). Это резко сужает распределение вывода модели.
7. Будущие применения и направления исследований
Результаты открывают несколько направлений для будущей работы:
- Адаптивные репетиторы по промптам: Разработка репетиторов на основе ИИ, которые анализируют промпт учащегося и дают обратную связь в реальном времени о том, как его улучшить (например, «Попробуй указать свою аудиторию»).
- Лонгитюдные исследования: Отслеживание того, как навыки инженерии промптов у учащихся развиваются со временем при наличии и отсутствии формального обучения.
- Кросс-культурные и лингвистические сравнения: Исследование того, различаются ли стратегии инженерии промптов в разных языках и культурных образовательных контекстах.
- Интеграция с педагогикой письма: Исследование того, как структуры инженерии промптов могут быть вплетены в существующие модели процесса письма (предварительное написание, черновик, редактирование).
- Этические и критические аспекты: Расширение AI-грамотности за пределы эффективности, включив критическую оценку выводов ИИ, обнаружение смещений и этичное использование.
8. Список литературы
- Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. Manuscript in preparation.
- Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
- Long, D., & Magerko, B. (2020). What is AI Literacy? Competencies and Design Considerations. Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems, 1–16.
- OpenAI. (2023). GPT-4 Technical Report. arXiv preprint arXiv:2303.08774.
- Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.
- The Stanford Center for AI Safety. (n.d.). AI Literacy. Retrieved from https://aisafety.stanford.edu/ai-literacy
Взгляд аналитика: Деконструкция императива инженерии промптов
Ключевая идея: Это исследование не только об учащихся и ChatGPT; это микрокосм фундаментальной проблемы взаимодействия человека и ИИ в эпоху после ChatGPT. Ключевая идея заключается в том, что «промптинг — это новое программирование». Четыре стратегии (Минималист, Итеративный улучшатель, Структурированный планировщик, Исследователь-тестировщик) — это не просто стили обучения; это прототипы архетипов пользователей, которые будут определять разрыв в продуктивности и креативности в рабочей силе, усиленной ИИ. В статье правильно отмечено, что без структурированного образования большинство пользователей по умолчанию выберут неэффективные стратегии Минималиста или проб и ошибок (Итеративный улучшатель), оставляя огромный потенциал таких инструментов, как GPT-4, подробно описанный в его техническом отчёте, неиспользованным.
Логика и сильные стороны: Сила статьи заключается в её обоснованном, эмпирическом подходе. Используя записи экранов, она фиксирует сырую, нефильтрованную борьбу новичка. Это выводит дискурс за рамки теоретических структур AI-грамотности (таких как у Long & Magerko) в наблюдаемую практику. Идентификация Структурированного планировщика как высокоэффективной стратегии имеет решающее значение. Это подтверждает отраслевую гипотезу о том, что эффективный промптинг напоминает спецификацию — чёткую, ограниченную и контекстуализированную. Это согласуется с исследованиями о том, как большие языковые модели (LLM) функционируют как «стохастические попугаи», управляемые условными распределениями вероятностей; точный промпт математически сужает пространство вывода, как обсуждается в комплексных обзорах, подобных обзору Zhao et al.
Недостатки и слепые пятна: Основной недостаток исследования — его ограниченный масштаб — одно задание с пользователями-новичками. Оно не показывает, может ли Исследователь-тестировщик, демонстрирующий, возможно, самую высокую внутреннюю любознательность и исследование системы, со временем стать самым опытным пользователем. Кроме того, оно обходит критическое измерение этической и критической грамотности. Учащийся может быть блестящим Структурированным планировщиком, создавая безупречное, убедительное эссе с помощью ChatGPT, но оставаться совершенно некритичным к смещениям, фактическим неточностям или отсутствию оригинальной мысли в выводе. Как подчёркивают такие учреждения, как Stanford Center for AI Safety, истинная AI-грамотность должна включать оценку, а не только генерацию.
Практические выводы: Для педагогов и политиков вывод не подлежит обсуждению: Инженерия промптов должна быть основным, оцениваемым компонентом учебных программ по цифровой грамотности, начиная с настоящего момента. Это не опционально. Исследование предоставляет план: перевести учащихся от пассивных потребителей вывода ИИ (Минималист) к активным, стратегическим руководителям (Структурированный планировщик). Планы уроков должны явно обучать структурам промптов — роль, аудитория, формат, тон, примеры (РАФТП). Для разработчиков технологий вывод заключается в том, чтобы встроить «скаффолдинг промптов» непосредственно в образовательные интерфейсы — интерактивные шаблоны, движки предложений и метакогнитивные подсказки, которые спрашивают пользователей: «Вы подумали о том, чтобы указать...?» Будущее принадлежит не тем, кто может использовать ИИ, а тем, кто может управлять им с точностью и критическим мышлением.