1. Pengenalan
Bahasa Inggeris mendominasi komunikasi akademik, profesional dan sosial global, namun berjuta-juta pembaca yang mana Bahasa Inggeris adalah Bahasa Asing (EFL) bergelut dengan kefahaman. Sumber tradisional seperti pendidikan formal atau alat terjemahan teks penuh (cth., Google Translate) selalunya tidak boleh diakses, mahal, atau kontraproduktif untuk pembelajaran. Reading.help menangani jurang ini dengan mencadangkan pembantu bacaan pintar yang memanfaatkan Pemprosesan Bahasa Asli (NLP) dan Model Bahasa Besar (LLM) untuk memberikan penjelasan proaktif dan atas permintaan tentang tatabahasa dan semantik, bertujuan untuk memupuk kemahiran membaca bebas dalam kalangan pelajar EFL dengan kemahiran peringkat universiti.
2. Reka Bentuk Sistem & Metodologi
2.1. Antara Muka Reading.help
Antara muka (Rajah 1) direka untuk kejelasan dan utiliti. Komponen utama termasuk: (A) Ringkasan kandungan, (B) Tahap ringkasan boleh laras (ringkas/terperinci), (C) Alat sokongan kontekstual dicetuskan oleh pemilihan teks, (D) Menu alat yang menawarkan bantuan Istilah Leksikal, Kefahaman, dan Tatabahasa, (E) Pengenalpastian proaktif kandungan mencabar setiap perenggan, (F) Penjelasan kosa kata dengan definisi dan konteks, (G) Saluran pengesahan dua-LLM untuk kualiti penjelasan, dan (H) Penyerlahan visual yang menghubungkan cadangan kepada teks asal.
2.2. Modul Teras: Pengenalpastian & Penjelasan
Sistem ini dibina atas dua modul khusus:
- Modul Pengenalpastian: Mengesan perkataan, frasa, dan struktur sintaksis yang berpotensi sukar untuk pembaca EFL menggunakan gabungan heuristik berasaskan peraturan (cth., kosa kata frekuensi rendah, panjang ayat kompleks) dan model neural yang ditala halus.
- Modul Penjelasan: Menjana penjelasan untuk kosa kata, tatabahasa, dan konteks keseluruhan. Ia menggunakan LLM (seperti GPT-4) yang diprompt dengan arahan khusus untuk penjelasan peringkat EFL, memastikan kejelasan dan nilai pedagogi.
2.3. Saluran Pengesahan LLM
Satu inovasi kritikal ialah proses pengesahan dwi-LLM. LLM pertama menjana penjelasan. LLM kedua yang berasingan bertindak sebagai pengesah, menilai output LLM pertama untuk ketepatan fakta, relevans, dan kesesuaian untuk sasaran peringkat EFL. Proses ini, diilhamkan oleh teknik seperti kekonsistenan diri dan pengesahan rantai pemikiran yang dilihat dalam penyelidikan AI maju, bertujuan untuk mengurangkan halusinasi dan meningkatkan kebolehpercayaan—satu kebimbangan biasa dalam aplikasi pendidikan LLM.
3. Kajian Kes & Penilaian
3.1. Kajian dengan Pembaca EFL Korea Selatan
Pembangunan mengikuti proses reka bentuk berpusatkan manusia. Prototaip awal diuji dengan 15 pembaca EFL Korea Selatan. Maklum balas memberi tumpuan kepada kebolehgunaan antara muka, kejelasan penjelasan, dan keberkesanan yang dirasakan bagi cadangan proaktif. Maklum balas ini secara langsung memaklumkan semakan yang membawa kepada sistem Reading.help akhir.
3.2. Keputusan & Maklum Balas Pengguna
Penilaian akhir dijalankan dengan 5 pembaca EFL dan 2 profesional pendidikan EFL. Penemuan kualitatif mencadangkan bahawa:
- Pengguna menghargai penjelasan atas permintaan untuk elemen mengelirukan tertentu.
- Penyerlahan proaktif membantu mengarahkan perhatian kepada kawasan kesukaran berpotensi sebelum kekeliruan timbul.
- Peserta melaporkan peningkatan keyakinan dalam menghuraikan ayat kompleks secara bebas.
- Profesional melihat potensi alat ini sebagai bantuan pembelajaran kendiri tambahan di luar bilik darjah.
Kajian Pengguna Awal
15
Pembaca EFL (Korea Selatan)
Penilaian Akhir
7
Peserta (5 Pembaca + 2 Profesional)
Modul Teras
2
Pengenalpastian & Penjelasan
4. Pelaksanaan Teknikal
4.1. Seni Bina NLP & LLM
Sistem ini menggunakan seni bina saluran paip. Teks pertama kali diproses melalui modul pengenalpastian, yang menggunakan ciri seperti:
- Kekerapan perkataan (cth., berbanding Korpus Bahasa Inggeris Amerika Kontemporari).
- Kedalaman pokok huraian sintaksis.
- Kehadiran ungkapan idiomatik atau rujukan budaya.
4.2. Formulasi Matematik untuk Pemarkahan Kesukaran
Modul pengenalpastian memberikan markah kesukaran komposit $D_s$ kepada segmen teks $s$ (cth., ayat atau frasa). Markah ini adalah jumlah wajaran nilai ciri ternormal: $$D_s = \sum_{i=1}^{n} w_i \cdot f_i(s)$$ Di mana:
- $f_i(s)$ ialah nilai ternormal (antara 0 dan 1) bagi ciri $i$ untuk segmen $s$ (cth., frekuensi dokumen songsang (IDF) untuk kelangkaan kosa kata, kedalaman pokok huraian).
- $w_i$ ialah wajaran yang dipelajari untuk ciri $i$, mencerminkan kepentingannya dalam meramal kesukaran pembaca EFL, berpotensi diperoleh daripada data kajian pengguna.
- $n$ ialah jumlah bilangan ciri.
5. Keputusan & Perbincangan
5.1. Metrik Prestasi Utama
Walaupun kertas kerja menekankan penemuan kualitatif, metrik tersirat untuk kejayaan termasuk:
- Pengurangan dalam Carian Luaran: Pengguna kurang bergantung pada aplikasi kamus atau terjemahan berasingan.
- Peningkatan Ketepatan Kefahaman: Diukur melalui kuiz selepas membaca pada teks berbantu alat vs. tidak berbantu.
- Kepuasan Pengguna & Kebergunaan Dirasakan: Penarafan tinggi dalam soal selidik selepas kajian.
- Ketepatan Pengesahan Penjelasan: Peratusan penjelasan yang dijana LLM yang dianggap "betul dan membantu" oleh LLM pengesah kedua dan/atau penilai manusia.
5.2. Carta: Peningkatan Kefahaman vs. Penggunaan Alat
Rajah 2 (Konseptual): Skor Kefahaman mengikut Keadaan. Carta bar membandingkan skor kefahaman purata merentasi tiga keadaan: 1) Membaca tanpa sebarang bantuan (Asas), 2) Membaca dengan penterjemah teks penuh, dan 3) Membaca dengan Reading.help. Hipotesis, disokong oleh maklum balas pengguna, adalah bahawa Reading.help akan menghasilkan skor jauh lebih tinggi daripada asas dan setanding dengan atau lebih baik daripada terjemahan, sambil menggalakkan penglibatan lebih mendalam dengan teks Bahasa Inggeris dan bukannya memintasnya.
Wawasan Utama
- Proaktif + Atas Permintaan adalah Kunci: Menggabungkan kedua-dua mod bantuan memenuhi keperluan pembaca yang berbeza dan saat kekeliruan.
- LLM Perlukan Pengawal untuk Pendidikan: Pengesahan dwi-LLM adalah langkah pragmatik ke arah output AI yang boleh dipercayai dan pedagogi.
- Sasarkan Jurang "Pembelajar Bebas": Berkesan menangani keperluan sokongan boleh skala antara kelas formal dan automasi penuh (terjemahan).
- Reka Bentuk Berpusatkan Manusia adalah Tidak Boleh Dirunding: Ujian berulang dengan pengguna EFL sebenar adalah penting untuk memperhalus keberkesanan alat.
6. Kerangka Analisis & Contoh Kes
Kerangka: Keberkesanan alat boleh dianalisis melalui lensa Teori Beban Kognitif. Ia bertujuan untuk mengurangkan beban kognitif luaran (usaha yang dibelanjakan untuk mencari definisi atau menghuraikan tatabahasa) dengan menyediakan penjelasan bersepadu, seterusnya membebaskan sumber mental untuk beban kognitif relevan (kefahaman mendalam dan pembelajaran).
Contoh Kes (Tiada Kod): Pertimbangkan seorang pembaca EFL menemui ayat ini dalam artikel berita: "The central bank's hawkish stance, intended to curb inflation, has sent ripples through the bond market."
- Pengenalpastian: Sistem menyerlahkan "hawkish stance," "curb inflation," dan "sent ripples through" sebagai berpotensi mencabar (idiom kewangan frekuensi rendah, frasa metafora).
- Penjelasan Atas Permintaan (Pengguna klik pada 'hawkish stance'): Alat Istilah Leksikal menjelaskan: "Dalam ekonomi, 'hawkish' menggambarkan dasar yang memberi tumpuan agresif kepada mengawal inflasi, walaupun ia menaikkan kadar faedah. 'Stance' ialah kedudukan atau sikap. Jadi, 'hawkish stance' bermaksud bank mengambil kedudukan yang kuat dan agresif terhadap inflasi."
- Bantuan Kefahaman Proaktif: Alat Kefahaman untuk perenggan mungkin merumuskan: "Perenggan ini menjelaskan bahawa tindakan agresif bank pusat untuk melawan inflasi menyebabkan kesan ketara dalam pasaran bon."
7. Aplikasi Masa Depan & Hala Tuju Penyelidikan
- Pemperibadian: Menyesuaikan pengenalpastian kesukaran dan kedalaman penjelasan kepada tahap kemahiran terbukti individu dan sejarah pembelajaran.
- Input Multimodal: Memperluaskan sokongan kepada audio (podcast) dan video (kuliah) dengan teks dan penjelasan yang disegerakkan.
- Penggamakan & Penjejakan Pembelajaran Jangka Panjang: Menggabungkan pengulangan berjarak untuk kosa kata yang dipelajari melalui alat dan menjejaki kemajuan dari masa ke masa.
- Pasangan Bahasa Lebih Luas: Menggunakan kerangka yang sama untuk menyokong pembaca bahasa dominan lain (cth., Mandarin, Sepanyol) sebagai bahasa asing.
- Integrasi dengan Sistem Pengurusan Pembelajaran (LMS) Formal: Menjadi pemalam untuk platform seperti Moodle atau Canvas untuk membantu pelajar dengan bacaan kursus.
- AI Boleh Diterangkan Lanjutan (XAI): Membuat penaakulan model pengenalpastian lebih telus (cth., "Ayat ini diserlahkan kerana mengandungi konstruksi suara pasif dan frasa nama frekuensi rendah").
8. Rujukan
- Chung, S., Jeon, H., Shin, S., & Hoque, M. N. (2025). Reading.help: Supporting EFL Readers with Proactive and On-Demand Explanation of English Grammar and Semantics. arXiv preprint arXiv:2505.14031v2.
- Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30 (NIPS 2017).
- Brown, T., et al. (2020). Language Models are Few-Shot Learners. Advances in Neural Information Processing Systems 33 (NeurIPS 2020).
- Sweller, J. (1988). Cognitive load during problem solving: Effects on learning. Cognitive Science, 12(2), 257-285.
- Google AI. (2023). Best practices for prompting and evaluating large language models. Retrieved from [Google AI Blog].
- Nation, I. S. P. (2001). Learning Vocabulary in Another Language. Cambridge University Press.
9. Analisis Pakar: Teras Wawasan, Aliran Logik, Kekuatan & Kelemahan, Wawasan Boleh Tindak
Teras Wawasan: Reading.help bukan sekadar pembungkus terjemahan lain; ia adalah campur tangan sasaran dalam proses kognitif membaca dalam bahasa asing. Inovasi sebenarnya terletak pada model bantuan hibrid proaktif/reaktif digandingkan dengan mekanisme pengesahan untuk output LLM. Ini memposisikannya bukan sebagai tongkat (seperti terjemahan penuh), tetapi sebagai "perancah kognitif"—konsep yang disokong baik oleh teori pendidikan seperti Zon Perkembangan Proksimal Vygotsky. Ia mengakui bahawa matlamat untuk pelajar mahir bukan sekadar memahami teks ini, tetapi membina kemahiran untuk memahami teks seterusnya secara bebas.
Aliran Logik: Logik kertas kerja adalah kukuh dan berfokuskan pengamal: 1) Kenal pasti pasaran sebenar yang kurang mendapat perkhidmatan (pelajar EFL dewasa bebas), 2) Diagnosis kegagalan penyelesaian sedia ada (terjemahan menggalakkan kebergantungan, kamus kekurangan konteks), 3) Cadangkan seni bina teknikal novel (pengenalpastian + penjelasan + pengesahan) yang secara langsung menangani kegagalan tersebut, 4) Sahkan melalui ujian berulang, berpusatkan manusia. Ini adalah contoh buku teks penyelidikan HCI gunaan dengan logik kesesuaian produk-pasaran yang jelas.
Kekuatan & Kelemahan:
- Kekuatan: Pengesahan dwi-LLM adalah hack pragmatik dan perlu dalam landskap AI hari ini yang cenderung halusinasi. Fokus pada bantuan kefahaman peringkat perenggan, bukan sekadar carian perkataan, adalah bijak secara pedagogi. Pilihan pengguna sasaran (peringkat universiti) adalah bijak—mereka mempunyai asas tatabahasa/kosa kata untuk mendapat manfaat paling banyak daripada sokongan semantik dan sintaksis bernuansa.
- Kelemahan/Kekurangan Mencolok: Penilaian adalah terlalu ringan secara berbahaya pada data kuantitatif, longitudinal. Adakah penggunaan alat sebenarnya meningkatkan kecekapan membaca jangka panjang, atau hanya kefahaman segera? Kertas kerja senyap. "Modul pengenalpastian" digambarkan sebagai "model neural khusus," tetapi seni binanya, data latihan, dan metrik ketepatannya adalah legap—tanda amaran utama untuk kredibiliti teknikal. Tambahan pula, ia mengabaikan potensi untuk bias automasi; pengguna mungkin menerima penjelasan LLM secara tidak kritis, terutamanya selepas pengesah memberikan rasa selamat palsu.
Wawasan Boleh Tindak:
- Untuk Penyelidik: Langkah seterusnya mestilah kajian longitudinal terkawal yang ketat mengukur pengekalan dan pemindahan kemahiran. Juga, sumber terbuka seni bina model pengenalpastian dan penanda arasnya terhadap metrik kebolehbacaan standard (cth., Flesch-Kincaid) untuk mewujudkan kredibiliti teknikal.
- Untuk Pemaju Produk: Kerangka ini sudah matang untuk dikomersialkan. Peta jalan produk segera harus memberi tumpuan kepada pemperibadian (bahagian terbesar yang hilang) dan integrasi pelayar/PDF yang lancar. Pertimbangkan model freemium dengan serlahan asas dan peringkat premium dengan penguraian tatabahasa lanjutan dan dek kosa kata diperibadikan.
- Untuk Pendidik: Pilotkan alat ini sebagai sokongan wajib untuk tugasan bacaan intensif dalam kursus EFL universiti. Gunakannya untuk menjana perbincangan dengan meminta pelajar membandingkan penjelasan AI dengan inferens mereka sendiri, menjadikan alat ini sebagai rakan debat dan bukannya oracle.