1. المقدمة
يُشكِّل ظهور روبوتات الدردشة الذكية المولِّدة المتطورة (SOTA) مثل ChatGPT فرصًا وتحديات للتعليم، خاصة في تعلم اللغات. تبحث هذه الورقة في كيفية انخراط طلاب المرحلة الثانوية متعلمي الإنجليزية كلغة أجنبية (EFL)، كمستخدمين مبتدئين، في هندسة الأوامر - مهارة صياغة التعليمات للذكاء الاصطناعي - لإنجاز مهمة كتابة. المشكلة الأساسية هي أن التعاون الفعَّال مع ChatGPT ليس بديهيًا؛ فهو يتطلب مهارة مُكتَسَبة يفتقر إليها العديد من الطلاب، مما يؤدي إلى عمليات تجريبية غير فعالة. تهدف هذه الدراسة إلى رسم خرائط المسارات المتنوعة التي يسلكها الطلاب، وتحليل محتوى أوامرهم وجودتها وتطورها، لتوجيه الاستراتيجيات التربوية لدمج ثقافة الذكاء الاصطناعي في فصل كتابة اللغة الإنجليزية كلغة أجنبية.
2. المنهجية
يستخدم هذا البحث منهج دراسة الحالة النوعية. تم جمع البيانات من تسجيلات شاشة أجهزة iPad لطلاب المرحلة الثانوية متعلمي الإنجليزية كلغة أجنبية في هونغ كونغ يستخدمون ChatGPT وروبوتات دردشة متطورة مماثلة لأول مرة لإنجاز مهمة كتابة موحدة. ركز التحليل على فحص تفصيلي للأوامر التي أنشأها الطلاب، وتسلسلاتها (المسارات)، والمخرجات المقابلة للذكاء الاصطناعي. حددت الدراسة أربعة مسارات نمطية متميزة بناءً على أنماط التفاعل، وتطور الأوامر، والنهج الاستراتيجي.
3. دراسات الحالة: أربعة مسارات لهندسة الأوامر
كشف التحليل عن أربعة أنماط تفاعل رئيسية، تمثل مستويات مختلفة من المشاركة والتفكير الاستراتيجي.
3.1. المسار أ: المُقتَصِد
استخدم الطلاب في هذا المسار أوامر قليلة جدًا وغالبًا ما تكون غامضة (مثل: "اكتب مقالًا عن التلوث"). أظهروا مشاركة تأملية منخفضة، وقبلوا المخرجات الأولى للذكاء الاصطناعي بأدنى حد من المراجعة أو التحديد. يسلط هذا المسار الضوء على نقص أساسي في فهم قدرات الذكاء الاصطناعي والحاجة إلى تعليمات دقيقة.
3.2. المسار ب: المُحَسِّن التكراري
بدأ هؤلاء الطلاب بأمر أساسي لكنهم انخرطوا في عملية تحسين متسلسلة. بناءً على المخرجات الأولية للذكاء الاصطناعي، أصدرُوا أوامر متابعة مثل "اجعله أطول"، "استخدم كلمات أبسط"، أو "أضف مثالاً". يُظهر هذا المسار فهماً ناشئًا للطبيعة التفاعلية والتكرارية للتعاون بين الإنسان والذكاء الاصطناعي.
3.3. المسار ج: المُخطِط المُنَظَّم
مسار أكثر تقدمًا حيث حاول الطلاب تنظيم المهمة للذكاء الاصطناعي منذ البداية. تضمنت الأوامر عناصر مثل لعب الأدوار ("أنت مدرس كتابة")، وتعليمات خطوة بخطوة ("أولاً، أعطني ثلاثة أفكار. ثم، ضع مخططًا للفكرة الأولى")، وقيود صريحة ("اكتب 150 كلمة باستخدام الزمن الماضي"). يُظهر هذا النهج التخطيط الاستراتيجي ونموذجًا أوضح لكيفية "برمجة" الذكاء الاصطناعي من خلال اللغة.
3.4. المسار د: المُختَبِر الاستكشافي
استخدم هؤلاء الطلاب عددًا كبيرًا من الأوامر المتنوعة، غالبًا ما تكون تجريبية. اختبروا حدود الذكاء الاصطناعي بطلبات إبداعية أو خارج الموضوع أو معقدة لفهم وظائفه قبل تطبيقها على المهمة الأساسية. يعكس هذا المسار عقلية استكشافية وخبيرة بالتكنولوجيا، لكنه قد لا يؤدي دائمًا إلى هدف المهمة بكفاءة.
4. النتائج والتحليل
4.1. أنماط جودة وكمية الأوامر
لوحظت علاقة واضحة بين تطور الأوامر وجودة المخرجات النهائية. أنتج المسار ج (المُخطِط المُنَظَّم) باستمرار النصوص الأكثر تماسكًا وملاءمة للمهمة وغنى لغويًا. كانت مخرجات المسار أ (المُقتَصِد) عامة وغالبًا ما تكون غير مستهدفة. لم تضمن كمية الأوامر وحدها (المرتفعة في المسار د) الجودة؛ كانت الجودة الاستراتيجية (المسار ج) هي العامل المميز الرئيسي.
ملخص تفاعل الأوامر
- المسار أ (المُقتَصِد): متوسط 2-3 أوامر؛ تحديدية منخفضة.
- المسار ب (المُحَسِّن التكراري): متوسط 5-8 أوامر؛ تحسين تفاعلي.
- المسار ج (المُخطِط المُنَظَّم): متوسط 4-6 أوامر؛ تخطيط مسبق عالٍ.
- المسار د (المُختَبِر الاستكشافي): متوسط 10+ أوامر؛ تنوع عالٍ، صلة مختلطة.
4.2. التأثير على مخرجات الكتابة
تختلف المنتجات الكتابية النهائية بشكل كبير. أدت الأوامر المنظمة إلى مخرجات تعالج متطلبات المهمة بشكل أفضل، وتستخدم مفردات أكثر ملاءمة، وتظهر تنظيمًا أوضح. أدت الأوامر المقتصدة إلى نصوص، رغم صحتها النحوية، تفتقر إلى العمق والتخصيص، وتشبه المحتوى العام على الويب.
5. النقاش: التضمينات لتعليم الثقافة الذكاء الاصطناعي
تؤكد الدراسة أن استخدام ChatGPT بفعالية هو مهارة مُكتَسَبة، وليست قدرة فطرية. يشير انتشار المسارات المقتصدة وغير الفعالة التكرارية بين المبتدئين إلى فجوة حرجة في التعليم الحالي. يجادل المؤلفون لصالح دمج تعليم هندسة الأوامر صراحةً في مناهج تعليم الإنجليزية كلغة أجنبية. وهذا سينقل الطلاب من مرحلة التجربة والخطأ، ويزودهم بأطر لصياغة تعليمات واضحة، وتعيين أدوار، وتحديد تنسيقات، وتحسين المخرجات بشكل تكراري - مما يحول الذكاء الاصطناعي من أداة غامضة إلى أداة تعاونية.
رؤى رئيسية
- هندسة الأوامر هي شكل جديد من محو الأمية الرقمية ضروري لعصر الذكاء الاصطناعي.
- نهج الطلاب تجاه الذكاء الاصطناعي غير متجانسة، مما يتطلب تعليمًا متمايزًا.
- جودة التعليمات (الأمر) تحدد مباشرة جودة المخرجات بمساعدة الذكاء الاصطناعي.
- بدون توجيه، يخاطر الطلاب بتطوير عادات تفاعل سلبية أو غير فعالة مع الذكاء الاصطناعي.
6. الإطار التقني والتحليل
من منظور تقني، تتفاعل هندسة الأوامر مع دوال الاحتمال للنموذج اللغوي الأساسي. يوجه الأمر المصاغ جيدًا $P$ النموذج $M$ لأخذ عينات من منطقة أكثر تقييدًا ومرغوبة من توزيع مخرجاته $D$ لسياق معين $C$. يمكن تمثيل العملية بشكل مجرد على أنها تعظيم الاحتمال الشرطي لتسلسل مخرجات مرغوب $O$:
$O^* = \arg\max_{O} P(O | C, P, M)$
حيث يزيد الأمر الغامض من الإنتروبيا في $D$، مما يؤدي إلى مخرجات عامة، بينما يقلل الأمر المحدد مع القيود (الدور، التنسيق، الأسلوب) من الإنتروبيا، ويوجه $M$ نحو $O^*$ أكثر استهدافًا. تمثل مسارات الطلاب بشكل فعال استراتيجيات مختلفة للتلاعب بهذا الاحتمال الشرطي من خلال تعليمات اللغة الطبيعية.
مثال على إطار التحليل
السيناريو: يريد طالب أن يساعده ChatGPT في كتابة فقرة إقناعية عن إعادة التدوير.
- أمر ضعيف (إنتروبيا عالية): "اكتب عن إعادة التدوير."
التحليل: النموذج لديه قيود دنيا، ومن المحتمل أن يولد نظرة عامة واسعة على غرار الموسوعة. - أمر قوي (إنتروبيا منخفضة): "تصرف كمدافع عن البيئة. اكتب فقرة إقناعية مكونة من 80 كلمة موجهة للمراهقين، تقنعهم بإعادة تدوير زجاجات البلاستيك. استخدم نبرة مباشرة وعاجلة، وتضمن إحصائية واحدة."
التحليل: يحدد هذا الأمر الدور (مدافع)، الجمهور (مراهقون)، الهدف (إقناع)، تركيز المحتوى (زجاجات بلاستيك)، الطول (80 كلمة)، النبرة (مباشرة، عاجلة)، والعنصر (إحصائية). يضيق بشكل كبير توزيع مخرجات النموذج.
7. التطبيقات المستقبلية واتجاهات البحث
تفتح النتائج عدة مسارات للعمل المستقبلي:
- مدرِّبون تكييفيون للأوامر: تطوير مدرِّبين مدعومين بالذكاء الاصطناعي يحللون أمر الطالب ويقدمون ملاحظات فورية حول كيفية تحسينه (مثل: "حاول تحديد جمهورك").
- دراسات طولية: تتبع كيفية تطور مهارات هندسة الأوامر لدى الطلاب مع مرور الوقت مع التعليم الرسمي وبدونه.
- مقارنات عبر الثقافات واللغات: التحقيق فيما إذا كانت استراتيجيات هندسة الأوامر تختلف عبر اللغات والسياقات التعليمية الثقافية.
- التكامل مع منهجية تعليم الكتابة: البحث في كيفية نسج أطر هندسة الأوامر في نماذج عملية الكتابة الحالية (ما قبل الكتابة، المسودة، المراجعة).
- الأبعاد الأخلاقية والنقدية: توسيع ثقافة الذكاء الاصطناعي لتتجاوز الكفاءة لتشمل التقييم النقدي لمخرجات الذكاء الاصطناعي، وكشف التحيز، والاستخدام الأخلاقي.
8. المراجع
- Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. Manuscript in preparation.
- Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
- Long, D., & Magerko, B. (2020). What is AI Literacy? Competencies and Design Considerations. Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems, 1–16.
- OpenAI. (2023). GPT-4 Technical Report. arXiv preprint arXiv:2303.08774.
- Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.
- The Stanford Center for AI Safety. (n.d.). AI Literacy. Retrieved from https://aisafety.stanford.edu/ai-literacy
منظور المحلل: تفكيك ضرورة هندسة الأوامر
الرؤية الأساسية: هذه الدراسة ليست فقط عن الطلاب وChatGPT؛ إنها نموذج مصغر لتحدي التفاعل الأساسي بين الإنسان والذكاء الاصطناعي في عصر ما بعد ChatGPT. الرؤية الأساسية هي أن "إصدار الأوامر" هو البرمجة الجديدة. المسارات الأربعة (المقتصد، المحسن التكراري، المخطط المنظم، المختبر الاستكشافي) ليست مجرد أنماط تعلم؛ إنها نماذج أولية لأنماط المستخدمين التي ستحدد فجوات الإنتاجية والإبداع في القوى العاملة المعززة بالذكاء الاصطناعي. تحدد الورقة بشكل صحيح أنه بدون التعليم المنظم، سيعتمد معظم المستخدمين على المسارات المقتصدة غير الفعالة أو التجريبية، مما يترك إمكانات هائلة لأدوات مثل GPT-4، كما هو مفصل في تقريره التقني، غير مستغلة.
التدفق المنطقي ونقاط القوة: تكمن قوة الورقة في نهجها التجريبي الملموس. باستخدام تسجيلات الشاشة، تلتقط الصراع الخام وغير المصفى للمبتدئ. وهذا ينقل النقاش إلى ما وراء الأطر النظرية لثقافة الذكاء الاصطناعي (مثل تلك الخاصة بـ Long & Magerko) إلى الممارسة الملحوظة. تحديد المخطط المنظم كمسار عالي الأداء أمر بالغ الأهمية. إنه يتحقق من فرضية الصناعة القائلة بأن إصدار الأوامر الفعال يشبه وثيقة مواصفات - واضحة، مقيدة، ومؤطرة سياقيًا. يتوافق هذا مع البحث حول كيفية عمل النماذج اللغوية الكبيرة (LLMs) كـ "ببغاوات عشوائية" يتم توجيهها بواسطة توزيعات الاحتمال الشرطي؛ يضيق الأمر الدقيق مساحة المخرجات رياضياً، كما نوقش في الدراسات الاستقصائية الشاملة مثل تلك التي أجراها Zhao وآخرون.
العيوب والنقاط العمياء: العيب الأساسي للدراسة هو نطاقها المحدود - مهمة واحدة مع مستخدمين لأول مرة. لا تظهر ما إذا كان المختبر الاستكشافي، الذي يُظهر بلا شك أعلى فضول جوهري واستكشاف للنظام، قد يتطور ليصبح المستخدم الأكثر مهارة مع مرور الوقت. علاوة على ذلك، تتجنب البعد الحاسم لـ محو الأمية الأخلاقية والنقدية. قد يكون الطالب مخططًا منظمًا بارعًا، وينتج مقالًا إقناعيًا لا تشوبه شائبة باستخدام ChatGPT، لكنه يظل غير نقدي تمامًا تجاه التحيزات، أو الأخطاء الواقعية، أو نقص التفكير الأصلي في المخرجات. كما تؤكد مؤسسات مثل مركز ستانفورد لسلامة الذكاء الاصطناعي، يجب أن تشمل ثقافة الذكاء الاصطناعي الحقيقية التقييم، وليس فقط التوليد.
رؤى قابلة للتنفيذ: بالنسبة للمعلمين وصناع السياسات، فإن النتيجة غير قابلة للتفاوض: يجب أن تكون هندسة الأوامر مكونًا أساسيًا يتم تقييمه في مناهج محو الأمية الرقمية، بدءًا من الآن. هذا ليس اختياريًا. توفر الدراسة مخططًا: نقل الطلاب من كونهم مستهلكين سلبيين لمخرجات الذكاء الاصطناعي (المقتصد) إلى مديرين استراتيجيين نشطين (المخطط المنظم). يجب أن تعلِّم خطط الدروس صراحةً أطر الأوامر - الدور، الجمهور، التنسيق، النبرة، الأمثلة (RAFTE). بالنسبة لمطوري التكنولوجيا، فإن الرؤية هي بناء "سقالات للأوامر" مباشرة في واجهات التعليم - قوالب تفاعلية، محركات اقتراح، وأوامر تأملية تسأل المستخدمين، "هل فكرت في تحديد...؟" المستقبل ليس لمن يستطيعون استخدام الذكاء الاصطناعي، بل لمن يستطيعون قيادته بدقة ونقدية.