1. المقدمة

تسيطر اللغة الإنجليزية على التواصل الأكاديمي والمهني والاجتماعي عالميًا، ومع ذلك يواجه ملايين القراء الناطقين بغير الإنجليزية (EFL) صعوبات في الفهم بسبب المفردات المعقدة والقواعد النحوية والإشارات الثقافية. الحلول التقليدية مثل التعليم الرسمي مكلفة ومحدودة، بينما يمكن لأدوات مثل القواميس الإلكترونية ومترجمات النص الكامل (مثل Google Translate) أن تعزز الاعتماد وتعيق التعلم النشط. تقدم هذه الورقة البحثية Reading.help، وهو مساعد قراءة ذكي مصمم لسد هذه الفجوة. يستفيد من معالجة اللغة الطبيعية (NLP) ونماذج اللغة الكبيرة (LLMs) لتقديم تفسيرات استباقية (يبدأها النظام) وتحت الطلب (يبدأها المستخدم)، بهدف دعم التفسير والتعلم المستقل للقراء الناطقين بغير الإنجليزية ذوي الكفاءة على مستوى الجامعة.

2. تصميم النظام والمنهجية

2.1. واجهة Reading.help

تعد واجهة المستخدم (الشكل 1) محورية لتجربة المستخدم. تشمل المكونات الرئيسية: (أ) ملخصات المحتوى، (ب) مستويات الملخص القابلة للتعديل (موجز/مفصل)، (ج) أدوات الدعم التي يتم تفعيلها عند تحديد النص، (د) قائمة أدوات تقدم مساعدة في المصطلحات المعجمية والفهم والقواعد النحوية، (هـ) التعرف الاستباقي على المحتوى الصعب في كل فقرة، (و) تفسيرات المفردات مع التعريفات والسياق، و(ح) التمييز المرئي الذي يربط الاقتراحات بالنص.

2.2. البنية ثنائية الوحدات

يُبنى Reading.help على وحدتين متخصصتين:

  1. وحدة التعرف: تكتشف الكلمات والعبارات والجمل التي من المرجح أن يجدها القارئ الناطق بغير الإنجليزية صعبة. من المحتمل أن يتضمن ذلك نموذجًا مُدربًا على مجموعات نصوص المتعلمين أو مقاييس الصعوبة.
  2. وحدة الشرح: تولد توضيحات للمفردات والقواعد النحوية والسياق العام للنص. يتم تشغيل هذه الوحدة بواسطة نماذج اللغة الكبيرة، المعدلة خصيصًا لتقديم تفسيرات تعليمية.
يستهدف النظام القراء الناطقين بغير الإنجليزية ذوي الدافع الذاتي، حيث يساعد دون أن يحل محل فعل القراءة نفسه.

2.3. عملية التحقق ثنائية النماذج اللغوية الكبيرة

الابتكار التقني الحاسم هو خط أنابيب التحقق ثنائي النماذج اللغوية الكبيرة (المكون G في الشكل 1). يولد النموذج اللغوي الكبير الأساسي التفسير. بعد ذلك، يقوم نموذج لغوي كبير ثاني منفصل بالتحقق من منطق وصحة مخرجات النموذج الأول. يعمل هذا كفحص للموثوقية، بهدف تقليل الهلوسة وتحسين جودة التفسير – وهو مصدر قلق كبير في التطبيقات التعليمية للنماذج اللغوية الكبيرة.

3. دراسة الحالة والتقييم

3.1. الدراسة مع قراء كوريا الجنوبية الناطقين بغير الإنجليزية

تم تطوير النظام بشكل تكراري. تم إنشاء نموذج أولي قائم على النماذج اللغوية الكبيرة استنادًا إلى الأدبيات السابقة. ثم تم اختبار هذا النموذج الأولي وتحسينه باستخدام الملاحظات من دراسة حالة شملت 15 قارئًا من كوريا الجنوبية الناطقين بغير الإنجليزية. كانت مرحلة التصميم المتمركز حول الإنسان هذه حاسمة لمطابقة وظائف الأداة مع احتياجات وسلوكيات المستخدمين الحقيقية.

3.2. نتائج التقييم النهائية

تم تقييم النسخة النهائية من Reading.help مع 5 قراء ناطقين بغير الإنجليزية و2 من محترفي تعليم اللغة الإنجليزية للناطقين بغيرها. تشير النتائج إلى أن الأداة لديها القدرة على مساعدة القراء الناطقين بغير الإنجليزية على الانخراط في التعلم الذاتي عندما لا يتوفر الدعم الخارجي (مثل المعلمين). تمت استقبال نموذج المساعدة الاستباقية وتحت الطلب بشكل إيجابي لدعم الفهم دون تشجيع الترجمة السلبية للنصوص بأكملها.

رؤى رئيسية

  • استباقية + تحت الطلب: الجمع بين اقتراحات النظام والتحكم من قبل المستخدم يوازن بين التوجيه والاستقلالية.
  • التحقق ثنائي النماذج اللغوية الكبيرة: نهج بسيط وعملي لتعزيز موثوقية المخرجات في الذكاء الاصطناعي التعليمي.
  • الجمهور المستهدف: التركيز على القراء الناطقين بغير الإنجليزية على مستوى الجامعة يعالج شريحة محددة وذات دافع.
  • التصميم المتمركز حول الإنسان: التطوير التكراري مع المستخدمين الحقيقيين كان مفتاحًا للارتباط الوظيفي.

4. التفاصيل التقنية والتحليل

4.1. الفكرة الأساسية والتسلسل المنطقي

الفكرة الأساسية: الرهان الأساسي للورقة البحثية هو أن أكبر عنق زجاجة للقراء المتقدمين الناطقين بغير الإنجليزية ليس البحث عن المفردات، بل إزالة الغموض السياقي والتحليل النحوي. تحل أدوات مثل القواميس مشكلة "ماذا" (التعريف)؛ بينما يهدف Reading.help إلى حل مشكلة "لماذا" و"كيف" – لماذا هذه الكلمة هنا، وكيف يعدل هذا الشرط ذلك الاسم. التسلسل المنطقي أنيق: 1) تحديد نقاط الصعوبة المحتملة (وحدة التعرف)، 2) توليد تفسيرات تعليمية (النموذج اللغوي الكبير الأساسي)، 3) فحص منطقية هذه التفسيرات (النموذج اللغوي الكبير الثانوي)، 4) عرضها من خلال واجهة مستخدم غير متطفلة ومرتبطة بالتمييز. هذا يخلق نظامًا حلقيًا مغلقًا يركز على سقالات الفهم بدلاً من الترجمة.

4.2. نقاط القوة والعيوب الجوهرية

نقاط القوة:

  • آلية تحقق مبتكرة: إعداد النموذجين اللغويين الكبيرين هو حيلة ذكية ومنخفضة التكلفة لمراقبة الجودة. إنه يعترف بمشكلة "الببغاء العشوائي" مباشرة، على عكس العديد من تطبيقات النماذج اللغوية الكبيرة التي تعامل المخرجات على أنها مسلّمات.
  • نطاق المشكلة المناسب: استهداف القراء على مستوى الجامعة يتجنب التعقيد الهائل للتكيف مع جميع مستويات الكفاءة. إنه سوق انطلاق قابل للتطبيق.
  • دقة واجهة المستخدم: تظهر مكونات الواجهة (أ-ح) تكاملاً مدروسًا لأدوات المساعدة مباشرة في سير عمل القراءة، مما يقلل من تبديل الحمل المعرفي.
عيوب جوهرية:
  • تقييم الصندوق الأسود: الضعف الرئيسي في الورقة البحثية هو التقييم. عدد المستخدمين = 5 ومحترفين = 2 هو قصصي، وليس تجريبيًا. أين المقاييس الكمية؟ درجات تحسن الفهم؟ مقايضات السرعة والدقة؟ مقارنة بخط أساس (مثل استخدام القاموس)؟ هذا النقص في التحقق الصارم يضعف بشدة الفعالية المزعومة.
  • كشف "الصعوبة" الغامض: تم وصف وحدة التعرف بعبارات غامضة. كيف يتم تعريف "المحتوى المحتمل الصعوبة" ونمذجته؟ بدون الشفافية، من المستحيل تقييم دقتها أو تحيزها.
  • القدرة على التوسع والتكلفة: تشغيل نموذجين لغويين كبيرين لكل طلب تفسير يضاعف تكلفة وزمن الاستدلال. بالنسبة لمساعد قراءة فوري، يمكن أن يكون هذا عنق زجاجة معيقًا للتوسع.

4.3. رؤى قابلة للتطبيق وتداعيات استراتيجية

للباحثين: هذا العمل هو مخطط لـ تصميم نماذج لغوية كبيرة مسؤولة ومساعِدة. يجب توحيد نمط النموذجين اللغويين الكبيرين للذكاء الاصطناعي التعليمي. يجب على العمل المستقبلي أن يحل محل التقييم الهش بدراسات مستخدم قوية ومقارنة (اختبارات A/B مقابل أدوات راسخة) ومقاييس تقييم موحدة للناطقين بغير الإنجليزية (مثل المأخوذة من أقسام القراءة في TOEFL أو IELTS).

لمطوري المنتجات: ميزة التمييز الاستباقي هي التطبيق القاتل. إنها تحول الأداة من تفاعلية إلى استباقية. يجب أن يركز مسار المنتج الفوري على: 1) تحسين خط أنابيب النموذجين اللغويين الكبيرين للسرعة (ربما باستخدام نموذج صغير وسريع للتحقق)، 2) تخصيص كشف "الصعوبة" بناءً على تاريخ تفاعل المستخدم الفردي، و3) استكشاف نموذج freemium حيث تكون التمييزات الأساسية مجانية، ولكن التفسيرات النحوية المفصلة مدفوعة.

التداعيات الأوسع: يمثل Reading.help تحولاً من الترجمة الآلية إلى التدريس الآلي. الهدف ليس استبدال النص الأصلي بل تمكين القارئ من التغلب عليه. يتوافق هذا مع الاتجاهات الأوسع في "الذكاء الاصطناعي للتعزيز" مقابل "الذكاء الاصطناعي للأتمتة"، كما نوقش في أبحاث معهد ستانفورد للذكاء الاصطناعي المتمركز حول الإنسان. إذا نجح، يمكن تطبيق هذا النهج على أنواع مستندات معقدة أخرى مثل العقود القانونية أو الأوراق العلمية لغير المتخصصين.

5. تحليل أصلي: ما وراء الواجهة

يقع Reading.help عند تقاطع مثير لثلاثة اتجاهات رئيسية: ديمقراطية تعلم اللغة، ونضج النماذج اللغوية الكبيرة المخصصة للمهام، والتركيز المتزايد على التعاون بين الإنسان والذكاء الاصطناعي. بينما تقدم الورقة البحثية دراسة حالة مقنعة، تكمن أهميتها الحقيقية في الإطار المنهجي الذي تشير إليه لبناء ذكاء اصطناعي تعليمي موثوق. آلية التحقق ثنائية النماذج اللغوية الكبيرة، وإن كانت مكلفة حسابيًا، هي استجابة مباشرة لأحد أكثر القيود التي يتم الاستشهاد بها للذكاء الاصطناعي التوليدي في التعليم: ميله إلى عدم الدقة الواثقة. هذا يردد مخاوف أثيرت في دراسات حول هلوسة النماذج اللغوية الكبيرة، مثل تلك الموثقة من قبل OpenAI وفي استطلاعات مثل "عن مخاطر الببغاوات العشوائية" (Bender et al., 2021). من خلال تنفيذ خطوة تحقق، فإن المؤلفين يبنون بشكل أساسي شكلاً بدائياً من "الذكاء الاصطناعي الدستوري"، حيث يكون مخرج نموذج واحد مقيدًا بمراجعة نموذج آخر، وهو مفهوم يكتسب زخمًا في أبحاث المحاذاة.

ومع ذلك، فإن البحث يقصر في تعريف مقياسه الأساسي: ما الذي يشكل مساعدة قراءة "ناجحة"؟ هل هي سرعة قراءة أسرع، وفهم أعمق، وزيادة في حفظ المفردات، أم مجرد ثقة المستخدم؟ لطالما ناضل مجال أنظمة التدريس الذكية (ITS) مع هذا، وغالبًا ما يستخدم مكاسب الاختبارات القبلية والبعدية كمعيار ذهبي. يمكن لأداة مثل Reading.help أن تستفيد من التكامل مع أطر تقييم الفهم القرائي الراسخة. علاوة على ذلك، فإن التركيز على القراء الكوريين الجنوبيين الناطقين بغير الإنجليزية، مع توفيره سياقًا ثقافيًا قيمًا، يثير تساؤلات حول قابلية التعميم. تختلف التحديات النحوية الإنجليزية بشكل كبير بين متحدثي لغة ذات ترتيب فاعل-مفعول-فعل (SOV) مثل الكورية ولغة ذات ترتيب فاعل-فعل-مفعول (SVO) مثل الإسبانية. تحتاج التكرارات المستقبلية إلى نموذج كشف صعوبة أكثر دقة ووعيًا لغويًا، ربما يستند إلى التحليل التقابلي من أبحاث اكتساب اللغة الثانية.

مقارنة بأدوات القراءة المعززة الأخرى، مثل "Read Along" السابق من Google أو النماذج الأولية البحثية مثل "Lingolette"، تكمن قوة Reading.help في دقته – حيث يقدم المساعدة على مستوى الكلمة والشرط والفقرة. ومع ذلك، فإنه يخاطر بخلق تأثير "العكاز" إذا كانت التفسيرات متاحة بسهولة كبيرة. يجب أن يتضمن التطور التالي التلاشي التكيفي، حيث يقلل النظام تدريجيًا من التلميحات الاستباقية كلما أظهر المستخدم إتقانًا لتراكيب نحوية أو عناصر معجمية معينة، وهو مبدأ مستمد من تصميم المعلم المعرفي. في النهاية، Reading.help هو دليل مفهوم واعد يسلط الضوء على كل من الإمكانات الهائلة والتحديات غير التافهة لنشر النماذج اللغوية الكبيرة كمدربين قراءة شخصيين.

6. الإطار التقني والنموذج الرياضي

بينما لا تفصل ملف PDF خوارزميات محددة، فإن النظام الموصوف يشير إلى عدة مكونات تقنية أساسية. يمكننا إضفاء الطابع الرسمي على العملية الأساسية.

1. تقدير درجة الصعوبة: من المرجح أن تقوم وحدة التعرف بتعيين درجة صعوبة $d_i$ لوحدة نص (كلمة، عبارة، جملة) $t_i$. يمكن أن يعتمد هذا على نموذج مركب: $$d_i = \alpha \cdot \text{Freq}(t_i) + \beta \cdot \text{SyntacticComplexity}(t_i) + \gamma \cdot \text{Ambiguity}(t_i)$$ حيث يمثل $\text{Freq}$ تكرار المستند العكسي أو التكرار في مجموعة نصوص المتعلمين، ويمكن أن يكون $\text{SyntacticComplexity}$ عمق شجرة التحليل، وقد يكون $\text{Ambiguity}$ عدد علامات جزء الكلام أو المعاني المحتملة. المعاملات $\alpha, \beta, \gamma$ هي أوزان مضبوطة على بيانات متعلمي اللغة الإنجليزية للناطقين بغيرها.

2. منطق التحقق ثنائي النماذج اللغوية الكبيرة: ليكن $\text{LLM}_G$ هو المولد و$\text{LLM}_V$ هو المدقق. لاستعلام إدخال $q$ (مثل "اشرح هذه الجملة")، العملية هي: $$e = \text{LLM}_G(q; \theta_G)$$ $$v = \text{LLM}_V(\text{concat}(q, e); \theta_V)$$ حيث $e$ هو التفسير، و$v$ هو مخرج التحقق (مثل "صحيح"، "غير صحيح"، "صحيح جزئيًا مع ملاحظة"). التفسير النهائي المعروض للمستخدم مشروط بـ $v$، مما قد يؤدي إلى إعادة التوليد إذا أشار $v$ إلى مشاكل خطيرة.

7. النتائج التجريبية ووصف المخططات

نص ملف PDF المقدم لا يتضمن نتائج كمية مفصلة أو مخططات. تم وصف التقييم بشكل نوعي:

  • العينة: التقييم النهائي مع 5 قراء ناطقين بغير الإنجليزية و2 محترفين.
  • الطريقة: على الأرجح مقابلات نوعية أو اختبارات قابلية استخدام بعد التفاعل مع الأداة.
  • المخطط/الشكل الضمني: الشكل 1 في الورقة البحثية هو مخطط واجهة النظام، يظهر المكونات من (أ) إلى (ح) كما هو موضح في محتوى ملف PDF. يوضح بصريًا تكامل لوحات الملخص وقوائم الأدوات والتمييز والنوافذ المنبثقة للتفسير داخل إطار قراءة واحد.
  • النتيجة المبلغ عنها: تشير النتائج إلى أن الأداة يمكن أن تساعد القراء الناطقين بغير الإنجليزية على التعلم الذاتي عندما ينعدم الدعم الخارجي. لم يتم الإبلاغ عن مقاييس إحصائية للتحسن (مثل درجات اختبار الفهم، تقليل الوقت المطلوب للمهمة).
هذا النقص في البيانات الكمية هو قيد كبير لتقييم تأثير الأداة.

8. إطار التحليل: حالة استخدام غير برمجية

فكر في باحث أو مدير منتج ناطق بغير الإنجليزية يريد تحليل فعالية ميزة مثل "التمييز الاستباقي". بدون الوصول إلى الكود، يمكنه استخدام إطار التحليل هذا:

الحالة: تقييم وحدة "كشف الصعوبة".

  1. تحديد مقاييس النجاح: ماذا يعني تمييز "جيد"؟ التعريفات التشغيلية المحتملة:
    • الدقة: من بين كل النص المميز من قبل النظام، ما النسبة المئوية التي نقر عليها المستخدمون بالفعل طلبًا للمساعدة؟ (الدقة العالية تعني أن التمييزات ذات صلة).
    • الاستدعاء: من بين جميع مقاطع النص التي اختارها المستخدمون يدويًا للمساعدة، ما النسبة المئوية التي تم تمييزها استباقيًا؟ (الاستدعاء العالي يعني أن النظام يتوقع معظم الاحتياجات).
    • رضا المستخدم: تقييم استبيان ما بعد الجلسة (1-5) على العبارة "جذبت التمييزات انتباهي إلى المناطق التي وجدتها صعبة".
  2. جمع البيانات: تسجيل جميع تفاعلات المستخدم: تمييزات النظام (مع درجة $d_i$ الخاصة بها)، نقرات المستخدم على التمييزات، اختيارات النص اليدوية للمستخدم خارج التمييزات.
  3. التحليل: حساب الدقة والاستدعاء لعتبات $d_i$ مختلفة. على سبيل المثال، إذا كان النظام يميز فقط العناصر ذات $d_i > 0.7$، هل تتحسن الدقة؟ ارسم منحنى الدقة-الاستدعاء للعثور على العتبة المثلى التي توازن بين الصلة والتغطية.
  4. التكرار: استخدم النتائج لإعادة ضبط المعاملات ($\alpha, \beta, \gamma$) في نموذج درجة الصعوبة، أو لإضافة ميزات جديدة (مثل تمييز الإشارات الثقافية).
يحول هذا الإطار الميزة ذات الصندوق الأسود إلى نظام قابل للتحليل باستخدام بيانات التفاعل، مما يوجه التحسين التكراري دون الحاجة إلى كود النموذج.

9. التطبيقات المستقبلية واتجاهات التطوير

يفتح نموذج Reading.help عدة مسارات واعدة:

  • مساعدون متخصصون قطاعيًا: تكييف المحرك الأساسي لقراءة الأوراق العلمية أو المستندات القانونية أو الكتيبات التقنية للقراء الخبراء غير الناطقين باللغة. ستحتاج وحدة التعرف إلى مجموعات نصوص صعوبة خاصة بالمجال.
  • التكامل متعدد الوسائط: الجمع بين تحليل النص وتوليف الكلام لإنشاء مساعد قراءة بصوت عالٍ يشرح المقاطع الصعبة أثناء السرد، مما يساعد في فهم الاستماع.
  • نمذجة المتعلم طويلة الأجل: تحويل الأداة من مساعد قائم على الجلسة إلى رفيق تعلم مدى الحياة. تتبع المفاهيم النحوية التي يبحث المستخدم باستمرار عن المساعدة فيها وإنشاء تمارين مراجعة مخصصة، مما يخلق حلقة تعلم مغلقة.
  • الانتقال عبر اللغات: للغات ذات موارد مماثلة، تطبيق نفس البنية لمساعدة قراء النصوص الصينية أو العربية أو الإسبانية. سيكون التحقق ثنائي النماذج اللغوية الكبيرة بنفس الأهمية.
  • التكامل مع التعلم الرسمي: الشراكة مع منصات التعلم عبر الإنترنت (Coursera, EdX) أو ناشري الكتب المدرسية الرقمية لتضمين وظائف Reading.help مباشرة في المواد التعليمية، وتقديم الدعم في الوقت المناسب للطلاب المسجلين.
  • تقنيات تحقق متقدمة: استبدال أو استكمال مدقق النموذج اللغوي الكبير الثانوي بطرق أكثر كفاءة: مدققات قائمة على القواعد للنحو، أو عمليات بحث في الرسوم البيانية المعرفية للاتساق الواقعي، أو نموذج "ناقد" أصغر ومقطر معدل خصيصًا للتحقق من التفسيرات.
الهدف النهائي هو سقالة قراءة تكيفية واعية بالسياق لا تساعد فقط في الفهم ولكن أيضًا تسرع اكتساب اللغة.

10. المراجع

  1. Chung, S., Jeon, H., Shin, S., & Hoque, M. N. (2025). Reading.help: Supporting EFL Readers with Proactive and On-Demand Explanation of English Grammar and Semantics. arXiv preprint arXiv:2505.14031v2.
  2. Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021). On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜. In Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency (pp. 610–623).
  3. Anderson, J. R., Corbett, A. T., Koedinger, K. R., & Pelletier, R. (1995). Cognitive Tutors: Lessons Learned. The Journal of the Learning Sciences, 4(2), 167–207.
  4. Stanford Institute for Human-Centered Artificial Intelligence (HAI). (2023). The AI Index 2023 Annual Report. Retrieved from https://hai.stanford.edu/research/ai-index-2023
  5. Nation, I. S. P. (2001). Learning Vocabulary in Another Language. Cambridge University Press.
  6. Google. (n.d.). Google Translate. Retrieved from https://translate.google.com
  7. Council of Europe. (2001). Common European Framework of Reference for Languages: Learning, teaching, assessment. Cambridge University Press.