دراسة حالة: مسارات هندسة الأوامر لطلاب المرحلة الثانوية (EFL) باستخدام ChatGPT في مهام الكتابة

جدول المحتويات

1. المقدمة

أحدث ظهور روبوتات الدردشة الذكية التوليدية المتطورة (SOTA) مثل ChatGPT تحولاً نموذجياً في دعم تعلم اللغات والكتابة. على عكس الأنظمة القديمة القائمة على القواعد، فإن هذه النماذج، المبنية على معماريات الشبكات العصبية مثل المُحوِّل (Transformer)، قادرة على توليد نص متماسك وذو صلة سياقية. بالنسبة لمتعلمي اللغة الإنجليزية كلغة أجنبية (EFL)، يمثل هذا أداة قوية لكنها معقدة. التحدي الأساسي الذي تم تحديده في هذه الدراسة هو هندسة الأوامر - وهي مهارة صياغة التعليمات الفعالة لاستنباط المخرجات المرغوبة من الذكاء الاصطناعي. بدون هذه المهارة، يُحصر المستخدمون، وخاصة الطلاب غير التقنيين، في عملية محبطة من التجربة والخطأ، مما يحد من الإمكانات التعليمية للأداة.

يتناول هذا البحث سلوكيات هندسة الأوامر الناشئة لطلاب المرحلة الثانوية (EFL) الذين يستخدمون ChatGPT لأول مرة لإنجاز مهمة كتابة. يتجاوز البحث النقاش النظري ليقدم دراسات حالة نوعية تجريبية ترسم مسارات مستخدم متميزة.

2. المنهجية وجمع البيانات

يستخدم البحث منهج دراسة الحالة النوعية، لتحليل بيانات التفاعل الواقعية من المستخدمين المبتدئين.

2.1. المشاركون والمهمة

كان المشاركون طلاب مرحلة ثانوية (EFL) ليس لديهم خبرة سابقة رسمية في استخدام روبوتات الدردشة المتطورة مثل ChatGPT. قامت الدراسة بتوثيق عملية تفاعلهم عبر تسجيلات شاشة الآيباد أثناء تعاملهم مع الذكاء الاصطناعي لإنجاز مهمة كتابة محددة. توفر هذه المنهجية رؤية خام وغير مُصفاة لعملية التعاون بين الإنسان والذكاء الاصطناعي.

2.2. إطار تحليل البيانات

تم تفريغ تسجيلات الشاشة وتحليلها لتصنيف:

محتوى الأمر: المكونات اللغوية والتعليمية لكل استفسار طالب (مثل: وصف المهمة، طلبات الأسلوب، القيود).
كمية الأوامر: عدد الأوامر المستخدمة لإكمال المهمة.
نمط التفاعل: تسلسل وطبيعة الأوامر اللاحقة بناءً على ردود الذكاء الاصطناعي.
جودة الناتج: مدى ملاءمة النص النهائي الذي يولده الذكاء الاصطناعي للمهمة الموكلة.

من هذا التحليل، تم تحديد أربعة مسارات نمطية للمستخدم وتطويرها إلى دراسات حالة مفصلة.

3. دراسات الحالة: أربعة مسارات لهندسة الأوامر

تجلّى التحليل في أربعة أنماط سلوكية متميزة، تمثل طيفاً من التطور في مهارة هندسة الأوامر.

3.1. المسار أ: المُقتصِد

استخدم هذا الطالب عدداً قليلاً جداً من الأوامر (مثلاً: 1-2). كان الأمر الأولي غالباً ترجمة بسيطة ومباشرة لتعليمات المهمة (مثل: "اكتب مقالاً عن تغير المناخ"). أظهر تفاعلاً ضئيلاً مع مخرجات الذكاء الاصطناعي، مقبولاً النتيجة الأولى مع تحسين قليل أو معدوم. يسلط هذا المسار الضوء على سوء فهم الأداة كـ "عرّاف"، حيث يُنظر إلى الذكاء الاصطناعي على أنه يقدم إجابة كاملة ونهائية بدلاً من كونه شريكاً تعاونياً.

3.2. المسار ب: المُحسِّن التكراري

استخدم هذا الطالب عدداً متوسطاً من الأوامر في تسلسل خطي وتكراري. بدأ بأمر أساسي، راجع المخرجات، وأصدر أوامر متابعة لتحسينات محددة (مثل: "اجعله أطول"، "استخدم كلمات أبسط"). يوضح هذا المسار فهماً ناشئاً لاستجابة الذكاء الاصطناعي للتعليمات ولكنه يبقى ضمن إطار طلب المراجعة الأساسي.

3.3. المسار ج: المُستفسِر المنهجي

استخدم هذا الطالب عدداً أكبر من الأوامر مع نهج استراتيجي متعدد المراحل. ربما يطلب أولاً من الذكاء الاصطناعي "طرح ثلاثة أفكار لمقال عن X"، ثم يختار واحدة، ثم يطلب مخططاً، وأخيراً يطلب مسودة بناءً على ذلك المخطط. يعكس هذا المسار استراتيجية ما وراء معرفية أكثر تطوراً، تقوم بتفكيك عملية الكتابة واستخدام الذكاء الاصطناعي لدعم منهجي في كل مرحلة.

3.4. المسار د: المُستكشِف بالتجربة والخطأ

استخدم هذا الطالب عدداً كبيراً من الأوامر مع تنوع كبير لكن مع استراتيجية واضحة قليلة. تغيرت الأوامر بشكل جذري في التركيز والأسلوب (مثلاً: من الرسمي إلى العامي، من الواسع إلى الضيق) دون تقدم واضح. يجسد هذا المسار التجريب غير المنظم الذي يميز تجربة المبتدئ، وغالباً ما يؤدي إلى الارتباك واستهلاك الوقت بشكل غير فعال، رغم أنه قد ينتج أحياناً نتائج إبداعية.

4. النتائج الرئيسية والتحليل

4.1. أنماط جودة وكمية الأوامر

لم تجد الدراسة علاقة بسيطة بين عدد الأوامر وجودة الناتج النهائي. غالباً ما أنتج المسار ج (المُستفسِر المنهجي) النص الأكثر ملاءمة للمهمة، ليس بالضرورة من خلال أكبر عدد من الأوامر، بل من خلال الأوامر الأكثر استراتيجية وجودة. تم تعريف الجودة من خلال التحديد، وتوفير السياق، وتفكيك المهمة. يمكن لأمر واحد مُصمم جيداً (مثل: "اكتب مقالاً إقناعياً طوله 300 كلمة لمجلة مدرسية يجادل لصالح زيادة صناديق إعادة التدوير في الحرم الجامعي، باستخدام إحصاءتين ونداء للعمل") أن يتفوق على عشرات الأوامر الغامضة.

ملخص التفاعل

المسار ج (المنهجي) أنتج باستمرار المسودات النهائية الأعلى تقييماً من قبل مقيمين مستقلين، رغم أنه لم يستخدم دائماً أكبر عدد من الأدوار. المسار د (التجربة والخطأ) كان لديه أعلى تباين في جودة النتائج.

4.2. دور الثقافة المعرفية بالذكاء الاصطناعي

توضح المسارات بوضوح مستويات متفاوتة من الثقافة المعرفية الضمنية بالذكاء الاصطناعي. افتقر الطلاب في المسارين أ و د إلى نموذج ذهني وظيفي لكيفية معالجة ChatGPT للطلبات. في المقابل، أظهر الطلاب في المسارين ب و ج فهماً ناشئاً للذكاء الاصطناعي كـ نظام احتمالي يتبع التعليمات. أدركوا بشكل حدسي أن المدخلات الأوضح والأكثر تنظيماً تؤدي إلى مخرجات أكثر قابلية للتنبؤ وفائدة. تدعم هذه النتيجة مباشرة دعوات منظمات مثل الجمعية الدولية لتكنولوجيا التعليم (ISTE) لدمج أساسيات الثقافة المعرفية بالذكاء الاصطناعي في مناهج التعليم الأساسي والثانوي.

5. الإطار التقني والتحليل

يتطلب فهم هذه المسارات عدسة تقنية. يعتمد ChatGPT والنماذج المشابهة على معمارية المُحوِّل (Transformer) وهي في الأساس مُتنبئات بالوحدة اللغوية التالية (next-token). يتم نمذجة احتمالية توليد تسلسل مخرجات محدد $O$ عند إعطاء أمر إدخال $P$ على النحو التالي: $$P(O|P) = \prod_{t=1}^{|O|} P(o_t | P, o_1, ..., o_{t-1})$$ حيث $o_t$ هي الوحدة اللغوية في الموضع $t$. يحدد أمر الطالب $P$ السياق الأولي وتوزيع الاحتمال للمخرجات.

مثال على إطار التحليل: يمكننا نمذجة جلسة هندسة الأوامر للطالب كآلة حالات. ليكن الحالة (S) هي نافذة السياق الحالية للمحادثة (آخر $k$ وحدة لغوية). الإجراء (A) هو الأمر التالي للطالب. المكافأة (R) هي الفائدة المُدرَكة لرد الذكاء الاصطناعي (مثلاً: درجة ذاتية من 1-5). هدف الطالب هو تعلم سياسة $\pi$ تربط الحالات بالإجراءات لتعظيم المكافأة التراكمية. تمثل المسارات الأربعة سياسات استكشاف مختلفة، وغالباً ما تكون دون المستوى الأمثل، لمشكلة التعلم المعزز هذه التي يواجهها المستخدم البشري.

وصف الرسم البياني: سيرسم مخطط مفاهيمي تحديدية الأمر (المحور السيني) مقابل تفكيك المهمة (المحور الصادي). سيتجمع المسار أ (المُقتصِد) في الربع المنخفض-المنخفض. سيظهر المسار د (التجربة والخطأ) كسحابة مبعثرة عبر الرسم البياني. سيظهر المسار ب (المُحسِّن التكراري) حركة أفقية نحو اليمين (زيادة في التحديدية). سيشغل المسار ج (المُستفسِر المنهجي) الربع المرتفع-المرتفع، مظهراً كل من التحديدية العالية والاستخدام العالي لتفكيك المهمة في أوامره.

6. التضمينات التعليمية والاتجاهات المستقبلية

التضمين الأساسي: ترك الطلاب لاكتشاف هندسة الأوامر عبر التجربة والخطأ غير فعال تربوياً وغير عادل. إنه يفضل الطلاب الذين يطورون التفكير الاستراتيجي بشكل طبيعي (المسار ج) ويضعف الآخرين.

استراتيجية قابلة للتنفيذ: يجب دمج تعليم هندسة الأوامر الصريح والمُدعَم في منهجية تدريس الكتابة لـ EFL. وهذا يشمل:

تعليم إطار الأمر "الدور-الهدف-التنسيق-القيود".
توضيح التحسين التكراري (مثلاً: استخدام وظائف "إعادة توليد" أو "متابعة" في ChatGPT بشكل استراتيجي).
التقييم النقدي لمخرجات الذكاء الاصطناعي من حيث التحيز والدقة والأسلوب.

البحث والتطوير المستقبلي:

واجهات التعلم التكيفية: يمكن لمساعدي الكتابة بالذكاء الاصطناعي المستقبليين اكتشاف مسار المستخدم (مثلاً: اكتشاف الأوامر المُقتصِدة) وعرض تلميحات سياقية أو دروس تعليمية لدعمهم نحو استراتيجيات أكثر فعالية.
مكتبات وقوالب الأوامر: تطوير قوالب أوامر مُنتقاة ومناسبة للمستوى لمهام الكتابة الشائعة لـ EFL (مثلاً: "مولد مقال المقارنة والتباين").
دراسات طولية: تتبع كيفية تطور مسارات هندسة الأوامر لدى الطلاب مع التعليم والخبرة بمرور الوقت.
دراسات عابرة للغات والثقافات: التحقيق فيما إذا كانت استراتيجيات هندسة الأوامر تختلف بشكل كبير عبر اللغات والثقافات التعليمية.

7. المراجع

Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. Manuscript in preparation.
Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
Long, D., & Magerko, B. (2020). What is AI Literacy? Competencies and Design Considerations. Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems, 1–16.
Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30 (NIPS 2017).
International Society for Technology in Education (ISTE). (2023). AI Explorations for Educators. Retrieved from iste.org.
Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.

8. منظور المحلل: تفكيك رقصة الكتابة بين الإنسان والذكاء الاصطناعي

الفكرة الأساسية: هذه الدراسة ليست في الحقيقة عن ChatGPT؛ إنها كشف صارخ عن الإنسان غير المُستعد في حلقة التغذية الراجعة بين الإنسان والذكاء الاصطناعي. الأداة أكثر قدرة بشكل كبير من قدرة المستخدم على توجيهها. المسارات الأربعة ليست مجرد سلوكيات؛ إنها مؤشرات تشخيصية لشكل جديد من الأمية الرقمية. الفجوة الحقيقية في المنتج ليست نموذج لغة أكبر وأفضل، بل طبقة واجهة بشرية أفضل تُعلِّم استراتيجية التفاعل في الوقت الفعلي.

التسلسل المنطقي: يحدد البحث المشكلة بشكل صحيح (التجربة والخطأ هي الوضع الافتراضي) ويقدم دليلاً أنيقاً تجريبياً من خلال تصنيف المسارات. القفزة المنطقية التي يقوم بها - وهذا أمر بالغ الأهمية - هي أن هذه السلوكيات المبتدئة ليست مرحلة مؤقتة. بدون تدخل، يمكن أن تتصلب مسارات المُقتصِد والمُستكشِف بالتجربة والخطأ إلى أنماط استخدام دائمة دون المستوى الأمثل، مما يُرسخ عدم تناسق في القوة حيث يقود المستخدم بواسطة الإعدادات الافتراضية للأداة بدلاً من توجيهها. يتوافق هذا مع مخاوف أوسع في أبحاث التفاعل بين الإنسان والحاسوب (HCI)، مثل تلك التي نوقشت في أعمال عن "التحيز نحو الأتمتة" و "تدهور المهارات" في الأنظمة عالية المساعدة.

نقاط القوة والضعف: قوتها تكمن في منهجيتها القائمة على الملاحظة. تسجيلات الشاشة لا تكذب. العيب الرئيسي، المُعترف به ضمنياً، هو النطاق. أربعة مسارات من عينة محدودة هي أنماط مثيرة للاهتمام، وليست فئات نهائية. يتجنب البحث أيضاً الفيل في الغرفة: التقييم. إذا حصل المُقتصِد على درجة نجاح من معلم مرهق باستخدام مقال مولَّد بالذكاء الاصطناعي، فما الحافز لديه لتعلم هندسة الأوامر؟ تعتمد توصيات البحث التعليمية على نظام يقدر العملية أكثر من المنتج، وهو ما لا تفعله معظم أطر التقييم التعليمي الحالية.

رؤى قابلة للتنفيذ: لمستثمري وتطويري تكنولوجيا التعليم، الاستنتاج واضح: الموجة التالية لخلق القيمة تكمن في السقالات الداعمة لهندسة الأوامر. فكر في Grammarly للأوامر - طبقة إضافية تحلل الأمر المبهم الأولي للطالب وتقترح: "حاول إضافة جمهور مستهدف وعدد كلمات. انقر هنا لرؤية مثال". بالنسبة لمديري المدارس، المهمة هي تمويل التطوير المهني ليس فقط حول استخدام الذكاء الاصطناعي، بل حول تعليم منهجية التفاعل مع الذكاء الاصطناعي. توفر هذه الدراسة الدليل المثالي للمطالبة بهذا البند في الميزانية. أخيراً، بالنسبة للباحثين، إطار المسارات هو عدسة قابلة للتكرار. طبقها على المحترفين الذين يستخدمون الذكاء الاصطناعي للبرمجة (GitHub Copilot)، أو التصميم، أو البحث القانوني. أتوقع أن تجد الأنماط الأربعة نفسها، مما يثبت أن هذا تحدي أساسي في التفاعل بين الإنسان والحاسوب، وليس مجرد قضية خاصة بـ EFL.