مطالعه موردی: مسیرهای مهندسی پرامپت دانش‌آموزان دبیرستانی زبان انگلیسی به عنوان زبان خارجی با ChatGPT برای تکالیف نوشتاری

فهرست مطالب

1. مقدمه

ظهور چت‌بات‌های هوش مصنوعی مولد پیشرفته (SOTA) مانند ChatGPT، تغییر پارادایمی در یادگیری زبان و پشتیبانی از نگارش ایجاد کرده است. برخلاف نسل‌های پیشین مبتنی بر قاعده، این مدل‌ها که بر پایه معماری‌های شبکه عصبی مانند ترنسفورمر ساخته شده‌اند، می‌توانند متنی منسجم و مرتبط با زمینه تولید کنند. برای زبان‌آموزان انگلیسی به عنوان زبان خارجی (EFL)، این یک ابزار قدرتمند و در عین حال پیچیده است. چالش اصلی شناسایی شده در این مطالعه، مهندسی پرامپت است - مهارت تدوین دستورالعمل‌های مؤثر برای استخراج خروجی‌های مطلوب از هوش مصنوعی. بدون این مهارت، کاربران، به ویژه دانش‌آموزان غیرفنی، به فرآیندی ناامیدکننده از آزمون و خطا تنزل می‌یابند که پتانسیل آموزشی ابزار را محدود می‌کند.

این مقاله به بررسی رفتارهای نوپای مهندسی پرامپت دانش‌آموزان دبیرستانی زبان انگلیسی به عنوان زبان خارجی می‌پردازد که برای اولین بار از ChatGPT برای انجام یک تکلیف نوشتاری استفاده می‌کنند. این مقاله فراتر از بحث نظری رفته و مطالعات موردی کیفی تجربی ارائه می‌دهد که مسیرهای متمایز کاربران را ترسیم می‌کند.

2. روش‌شناسی و گردآوری داده‌ها

این پژوهش از رویکرد مطالعه موردی کیفی استفاده می‌کند و داده‌های تعامل دنیای واقعی از کاربران مبتدی را تحلیل می‌کند.

2.1. شرکت‌کنندگان و تکلیف

شرکت‌کنندگان، دانش‌آموزان دبیرستانی زبان انگلیسی به عنوان زبان خارجی بودند که هیچ تجربه رسمی قبلی در استفاده از چت‌بات‌های پیشرفته‌ای مانند ChatGPT نداشتند. این مطالعه فرآیند کار آن‌ها را از طریق ضبط صفحه آیپد در حین تعامل با هوش مصنوعی برای انجام یک تکلیف نوشتاری مشخص، ثبت کرد. این روش‌شناسی، دیدی خام و بدون فیلتر از فرآیند همکاری انسان و هوش مصنوعی ارائه می‌دهد.

2.2. چارچوب تحلیل داده‌ها

ضبط‌های صفحه نمایش رونویسی و برای کدگذاری موارد زیر تحلیل شدند:

محتوای پرامپت: مؤلفه‌های زبانی و آموزشی هر پرسش دانش‌آموز (مانند شرح تکلیف، درخواست‌های سبکی، محدودیت‌ها).
کمیت پرامپت: تعداد پرامپت‌های استفاده شده برای تکمیل تکلیف.
الگوی تعامل: توالی و ماهیت پرامپت‌های پیگیری بر اساس پاسخ‌های هوش مصنوعی.
کیفیت نتیجه: تناسب متن نهایی تولید شده توسط هوش مصنوعی با تکلیف محول شده.

از این تحلیل، چهار مسیر کاربری آرکی‌تیپال شناسایی و به مطالعات موردی تفصیلی توسعه یافتند.

3. مطالعات موردی: چهار مسیر مهندسی پرامپت

تحلیل، چهار الگوی رفتاری متمایز را تبلور بخشید که طیفی از پیچیدگی مهندسی پرامپت را نشان می‌دهند.

3.1. مسیر الف: کمینه‌گرا

این دانش‌آموز از تعداد بسیار کمی پرامپت استفاده کرد (مثلاً ۱-۲ عدد). پرامپت اولیه اغلب ترجمه‌ای ساده و مستقیم از دستورالعمل تکلیف بود (مثلاً "یک مقاله درباره تغییرات آب و هوایی بنویس"). آن‌ها حداقل تعامل را با خروجی هوش مصنوعی نشان دادند و اولین نتیجه را با اصلاح اندک یا بدون اصلاح پذیرفتند. این مسیر بر سوءتفاهم ابزار به عنوان غیب‌گو تأکید می‌کند، جایی که هوش مصنوعی به عنوان ارائه‌دهنده پاسخی کامل و نهایی دیده می‌شود، نه یک شریک همکار.

3.2. مسیر ب: پالاینده تکراری

این دانش‌آموز از تعداد متوسطی پرامپت در یک توالی خطی و تکراری استفاده کرد. آن‌ها با یک پرامپت پایه شروع کردند، خروجی را مرور کردند و دستورات پیگیری برای بهبودهای خاص صادر کردند (مثلاً "آن را طولانی‌تر کن"، "از کلمات ساده‌تر استفاده کن"). این مسیر درک در حال ظهور از پاسخگویی هوش مصنوعی به دستورالعمل را نشان می‌دهد اما در چارچوب پایه‌ای درخواست بازنگری باقی می‌ماند.

3.3. مسیر ج: پرسشگر ساختاریافته

این دانش‌آموز از تعداد بیشتری پرامپت با رویکردی راهبردی و چندمرحله‌ای استفاده کرد. آن‌ها ممکن است ابتدا از هوش مصنوعی بخواهند "برای یک مقاله درباره X سه ایده طوفان فکری بده"، سپس یکی را انتخاب کنند، سپس یک چارچوب کلی درخواست کنند و در نهایت یک پیش‌نویس بر اساس آن چارچوب کلی بخواهند. این مسیر بازتاب‌دهنده یک راهبرد فراشناختی پیچیده‌تر است که فرآیند نوشتن را تجزیه می‌کند و از هوش مصنوعی برای پشتیبانی ساختاریافته در هر مرحله استفاده می‌کند.

3.4. مسیر د: کاوشگر آزمون و خطا

این دانش‌آموز از حجم بالایی پرامپت با تنوع قابل توجه اما با راهبرد آشکار کمی استفاده کرد. پرامپت‌ها به طور چشمگیری در تمرکز و سبک تغییر می‌کردند (مثلاً از رسمی به عامیانه، از گسترده به محدود) بدون پیشرفت واضح. این مسیر تجسم‌دهنده آزمایش بی‌ساختار است که تجربه مبتدیان را مشخص می‌کند و اغلب منجر به سردرگمی و استفاده ناکارآمد از زمان می‌شود، اگرچه گاهی ممکن است به نتایج خلاقانه‌ای منجر شود.

4. یافته‌های کلیدی و تحلیل

4.1. الگوهای کیفیت و کمیت پرامپت

این مطالعه هیچ همبستگی ساده‌ای بین تعداد پرامپت‌ها و کیفیت خروجی نهایی پیدا نکرد. مسیر ج (پرسشگر ساختاریافته) اغلب متن‌های مناسب‌ترین برای تکلیف را تولید می‌کرد، نه لزوماً از طریق بیشترین پرامپت، بلکه از طریق پرامپت‌های راهبردی و باکیفیت‌تر. کیفیت با مشخص بودن، ارائه زمینه و تجزیه تکلیف تعریف می‌شد. یک پرامپت مهندسی‌شده خوب (مثلاً "یک مقاله متقاعدکننده ۳۰۰ کلمه‌ای برای مجله مدرسه بنویس که برای نصب سطل‌های بازیافت بیشتر در محوطه دانشگاه استدلال می‌کند، با استفاده از دو آمار و یک دعوت به اقدام") می‌توانست از یک دوجین پرامپت مبهم بهتر عمل کند.

خلاصه تعامل

مسیر ج (ساختاریافته) به طور مداوم پیش‌نویس‌های نهایی با بالاترین امتیاز را توسط ارزیابان مستقل تولید کرد، علیرغم اینکه همیشه از بیشترین نوبت‌ها استفاده نمی‌کرد. مسیر د (آزمون و خطا) بیشترین واریانس را در کیفیت نتیجه داشت.

4.2. نقش سواد هوش مصنوعی

مسیرها به وضوح سطوح مختلف سواد ضمنی هوش مصنوعی را نشان می‌دهند. دانش‌آموزان در مسیرهای الف و د فاقد یک مدل ذهنی عملکردی از نحوه پردازش درخواست‌ها توسط ChatGPT بودند. در مقابل، دانش‌آموزان در مسیرهای ب و ج درک در حال رشدی از هوش مصنوعی به عنوان یک سیستم احتمالی و دنبال‌کننده دستورالعمل نشان دادند. آن‌ها به طور شهودی درک کردند که ورودی‌های واضح‌تر و ساختاریافته‌تر منجر به خروجی‌های قابل پیش‌بینی‌تر و مفیدتر می‌شوند. این یافته مستقیماً از فراخوان‌های سازمان‌هایی مانند انجمن بین‌المللی فناوری در آموزش (ISTE) برای ادغام اصول اولیه سواد هوش مصنوعی در برنامه‌های درسی پایه تا دوازدهم حمایت می‌کند.

5. چارچوب فنی و تحلیل

درک این مسیرها نیازمند یک لنز فنی است. ChatGPT و مدل‌های مشابه بر اساس معماری ترنسفورمر هستند و اساساً پیش‌بینیکننده توکن بعدی هستند. احتمال تولید یک دنباله خروجی خاص $O$ با توجه به یک پرامپت ورودی $P$ به صورت زیر مدل می‌شود: $$P(O|P) = \prod_{t=1}^{|O|} P(o_t | P, o_1, ..., o_{t-1})$$ که در آن $o_t$ توکن در موقعیت $t$ است. پرامپت دانش‌آموز $P$ زمینه اولیه و توزیع احتمال را برای خروجی تنظیم می‌کند.

مثال چارچوب تحلیل: می‌توانیم یک جلسه مهندسی پرامپت دانش‌آموز را به عنوان یک ماشین حالت مدل کنیم. اجازه دهید حالت (S) پنجره زمینه فعلی مکالمه (آخرین $k$ توکن) باشد. عمل (A) پرامپت بعدی دانش‌آموز است. پاداش (R) مفید بودن درک شده پاسخ هوش مصنوعی است (مثلاً یک امتیاز ذهنی از ۱ تا ۵). هدف دانش‌آموز یادگیری یک سیاست $\pi$ است که حالت‌ها را به اعمالی نگاشت می‌کند که پاداش تجمعی را بیشینه می‌کنند. چهار مسیر، سیاست‌های اکتشافی مختلف و اغلب زیربهینه را برای این مسئله یادگیری تقویتی که کاربر انسانی با آن مواجه است، نشان می‌دهند.

شرح نمودار: یک نمودار مفهومی، مشخص بودن پرامپت (محور X) را در مقابل تجزیه تکلیف (محور Y) ترسیم می‌کند. مسیر الف (کمینه‌گرا) در ربع پایین-پایین خوشه می‌شد. مسیر د (آزمون و خطا) یک ابر پراکنده در سراسر نمودار نشان می‌داد. مسیر ب (پالاینده تکراری) یک حرکت افقی به سمت راست (افزایش مشخص بودن) نشان می‌داد. مسیر ج (پرسشگر ساختاریافته) ربع بالا-بالا را اشغال می‌کرد و هم مشخص بودن بالا و هم استفاده بالا از تجزیه تکلیف را در پرامپت‌های خود نشان می‌داد.

6. پیامدهای آموزشی و جهت‌گیری‌های آینده

پیامد اصلی: رها کردن دانش‌آموزان برای کشف مهندسی پرامپت از طریق آزمون و خطا، از نظر آموزشی ناکارآمد و ناعادلانه است. این به نفع دانش‌آموزانی است که به طور طبیعی تفکر راهبردی توسعه می‌دهند (مسیر ج) و به دیگران ضرر می‌زند.

راهبرد عملی: آموزش صریح و داربست‌بندی شده مهندسی پرامپت باید در آموزش نگارش زبان انگلیسی به عنوان زبان خارجی ادغام شود. این شامل موارد زیر است:

آموزش چارچوب پرامپت "نقش-هدف-قالب-محدودیت‌ها".
نشان دادن پالایش تکراری (مثلاً استفاده راهبردی از عملکردهای "تولید مجدد" یا "ادامه" در ChatGPT).
ارزیابی انتقادی خروجی‌های هوش مصنوعی از نظر سوگیری، دقت و سبک.

پژوهش و توسعه آینده:

رابط‌های یادگیری سازگار: دستیاران نوشتاری هوش مصنوعی آینده می‌توانند مسیر کاربر را تشخیص دهند (مثلاً تشخیص پرامپت‌های کمینه‌گرا) و راهنمایی‌ها یا آموزش‌های زمینه‌ای برای داربست‌بندی آن‌ها به سمت راهبردهای مؤثرتر ارائه دهند.
کتابخانه‌ها و قالب‌های پرامپت: توسعه قالب‌های پرامپت مناسب سطح و گزینش‌شده برای تکالیف رایج نوشتاری زبان انگلیسی به عنوان زبان خارجی (مثلاً "مولد مقاله مقایسه و تضاد").
مطالعات طولی: ردیابی چگونگی تکامل مسیرهای مهندسی پرامپت دانش‌آموزان با آموزش و تجربه در طول زمان.
مطالعات بین‌زبانی و فرهنگی: بررسی اینکه آیا راهبردهای مهندسی پرامپت در بین زبان‌ها و فرهنگ‌های آموزشی به طور قابل توجهی متفاوت است.

7. منابع

Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. Manuscript in preparation.
Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
Long, D., & Magerko, B. (2020). What is AI Literacy? Competencies and Design Considerations. Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems, 1–16.
Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30 (NIPS 2017).
International Society for Technology in Education (ISTE). (2023). AI Explorations for Educators. Retrieved from iste.org.
Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.

8. دیدگاه تحلیلگر: واسازی رقص نوشتاری انسان و هوش مصنوعی

بینش اصلی: این مطالعه واقعاً درباره ChatGPT نیست؛ این یک افشای صریح از انسان آماده‌نشده در حلقه بازخورد انسان-هوش مصنوعی است. این ابزار به طور نمایی تواناتر از توانایی کاربر برای هدایت آن است. چهار مسیر فقط رفتارها نیستند؛ آن‌ها نشانگرهای تشخیصی برای شکلی جدید از بی‌سوادی دیجیتال هستند. شکاف واقعی محصول، یک مدل زبانی بزرگ بهتر نیست، بلکه یک لایه رابط انسانی بهتر است که راهبرد تعامل را در زمان واقعی آموزش می‌دهد.

جریان منطقی: مقاله به درستی مسئله را شناسایی می‌کند (آزمون و خطا حالت پیش‌فرض است) و از طریق رده‌بندی مسیرها، شواهد تجربی ظریفی ارائه می‌دهد. جهش منطقی که انجام می‌دهد - و این حیاتی است - این است که این رفتارهای مبتدی یک مرحله موقت نیستند. بدون مداخله، مسیرهای کمینه‌گرا و کاوشگر آزمون و خطا می‌توانند به الگوهای استفاده زیربهینه دائمی تبدیل شوند و یک عدم تقارن قدرت را تثبیت کنند که در آن کاربر توسط پیش‌فرض‌های ابزار هدایت می‌شود نه اینکه آن را هدایت کند. این با نگرانی‌های گسترده‌تر در پژوهش تعامل انسان و رایانه همسو است، مانند آنچه در آثار مربوط به "سوگیری اتوماسیون" و "زوال مهارت" در سیستم‌های با کمک‌رسانی بالا بحث شده است.

نقاط قوت و ضعف: نقطه قوت آن، روش‌شناسی مبتنی بر مشاهده است. ضبط‌های صفحه نمایش دروغ نمی‌گویند. ضعف اصلی، که به طور ضمنی تصدیق شده، مقیاس است. چهار مسیر از یک نمونه محدود، آرکی‌تیپ‌های قانع‌کننده‌ای هستند، نه مقوله‌های قطعی. این مطالعه همچنین از فیل سفید در اتاق اجتناب می‌کند: ارزیابی. اگر یک کمینه‌گرا از یک معلم پرکار با استفاده از یک مقاله تولید شده توسط هوش مصنوعی نمره قبولی بگیرد، چه انگیزه‌ای برای یادگیری مهندسی پرامپت دارد؟ توصیه‌های آموزشی مقاله بر سیستمی متکی است که فرآیند را بر محصول ارزش می‌نهد، که اکثر چارچوب‌های ارزیابی آموزشی فعلی اینگونه نیستند.

بینش‌های عملی: برای سرمایه‌گذاران و توسعه‌دهندگان فناوری آموزشی، نتیجه روشن است: موج بعدی ایجاد ارزش در داربست‌بندی مهندسی پرامپت است. به گرامرلی برای پرامپت‌ها فکر کنید - یک لایه رویی که دستور اولیه مبهم دانش‌آموز را تحلیل می‌کند و پیشنهاد می‌دهد: "سعی کنید یک مخاطب هدف و تعداد کلمات اضافه کنید. برای دیدن یک مثال اینجا کلیک کنید." برای مدیران مدارس، وظیفه تأمین مالی توسعه حرفه‌ای نه فقط در استفاده از هوش مصنوعی، بلکه در آموزش روش تدریس تعامل با هوش مصنوعی است. این مطالعه شواهد کاملی برای استدلال در مورد آن خط بودجه ارائه می‌دهد. در نهایت، برای پژوهشگران، چارچوب مسیر یک لنز قابل تکرار است. آن را روی متخصصانی که از هوش مصنوعی برای کدنویسی (GitHub Copilot)، طراحی یا پژوهش حقوقی استفاده می‌کنند اعمال کنید. پیش‌بینی می‌کنم همان چهار آرکی‌تیپ را پیدا خواهید کرد، که ثابت می‌کند این یک چالش اساسی تعامل انسان و رایانه است، نه فقط یک مسئله زبان انگلیسی به عنوان زبان خارجی.