Utangulizi

English dominates global academic, professional, and social communication, yet millions of English as a Foreign Language (EFL) readers struggle with comprehension due to complex vocabulary, grammar, and cultural references. Traditional solutions like formal education are costly and limited, while tools like electronic dictionaries and full-text translators (e.g., Google Translate) can foster dependency and hinder active learning. This paper introduces Reading.help, msaidizi mwenye akili wa usomaji ulioundwa kufunga pengo hili. Inatumia Usindikaji wa Lugha ya Asili (NLP) na Mifano Mikubwa ya Lugha (LLMs) kutoa makini (yanayoanzishwa na mfumo) na on-demand (user-initiated) explanations, aiming to support independent interpretation and learning for EFL readers with university-level proficiency.

2. System Design & Methodology

2.1. The Reading.help Interface

The user interface (Fig. 1) is central to the user experience. Key components include: (A) Content summaries, (B) Adjustable summary levels (concise/detailed), (C) Supporting tools activated by text selection, (D) A Tools menu offering Lexical Terms, Comprehension, and Grammar assistance, (E) Proactive identification of challenging content per paragraph, (F) Vocabulary explanations with definitions and context, and (H) Visual highlighting linking suggestions to the text.

2.2. Dual-Module Architecture

Reading.help imejengwa kwenye moduli mbili maalum:

  1. Moduli ya Kutambua: Inatambua maneno, misemo, na sentensi ambazo msomaji wa Klingereza kama lugha ya kigeni anaweza kuziona kuwa ngumu. Huenda ikahusisha modeli iliyofunzwa kwenye mkusanyiko wa matini za wanaojifunza au viwango vya ugumu.
  2. Moduli ya Ufafanuzi: Inatoa ufafanuzi kwa msamiati, sarufi, na muktadha wa maandishi kwa ujumla. Hii inaendeshwa na LLMs, zilizoboreshwa kwa ajili ya maelezo ya kielimu.
Mfumo unalenga wasomaji wa Kifaransa kama lugha ya kigeni wenye hamu ya kujimotisha, ukisaidia bila kuchukua nafasi ya kitendo cha kusoma chenyewe.

2.3. Mchakato wa Uthibitishaji wa LLM Mbili

Uvumbuzi muhimu wa kiufundi ni mfuatano wa uthibitishaji wa Dual-LLM (Sehemu G kwenye Mchoro 1). LLM kuu hutengeneza maelezo. LLM ya pili, tofauti, kisha inathibitisha mantiki na usahihi wa matokeo ya LLM ya kwanza. Hii inafanya kazi kama ukaguzi wa kuaminika, kwa lengo la kupunguza uwongo na kuboresha ubora wa maelezo—jambo la wasiwasi kubwa katika matumizi ya kielimu ya LLMs.

3. Case Study & Evaluation

3.1. Uchunguzi na Wasomaji wa Kikorea Kusini wa Kigeni cha Kiingereza

Mfumo ulitengenezwa kwa kufuatilia hatua kwa hatua. Kielelezo cha awali kilichotegemea LLM kiliundwa kulingana na fasihi ya awali. Kielelezo hiki kisha kilijaribiwa na kuboreshwa kwa kutumia maoni kutoka kwa utafiti wa kesi uliohusisha Wasomaji 15 wa Kikorea wa EFLHatua hii ya muundo iliyolenga binadamu ilikuwa muhimu kwa kulinganisha utendaji wa zana na mahitaji halisi ya watumiaji na tabia za kusoma.

3.2. Matokeo ya Mwisho ya Tathmini

Toleo la mwisho la Reading.help lilithaminishwa na Wasomaji 5 wa EFL na Wataalamu 2 wa elimu ya EFL. Matokeo yanaonyesha kuwa zana hiyo ina uwezo wa kuwasaidia wasomaji wa EFL kujihusisha na ujifunzaji wa kujiongoza wakati usaidizi wa nje (mfano, waalimu) haupatikani. Mtindo wa usaidizi unaotangulia na unaotolewa kulingana na mahitaji ulikubaliwa vyema kwa ajili ya kuunga mkono uelewa bila kuhimiza tafsiri ya kipasifu ya vifungu vyote.

Ufahamu Muhimu

  • Kukabiliana + Kwa Mahitaji: Kuchanganya mapendekezo ya mfumo na udhibiti wa mtumiaji hulinda usawa kati ya mwongozo na uhuru.
  • Uthibitishaji wa LLM-Mbili: Mbinu rahisi lakini ya vitendo ya kuboresha uaminifu wa matokeo katika AI ya elimu.
  • Watazamaji Walengwa: Kulenga wasomaji wa Kiingereza kama lugha ya kigeni katika ngazi ya chuo kikuu kulenga kikundi maalum, chenye motisha.
  • Ubunifu Unaozingatia Binadamu: Uendelezaji wa kurudia pamoja na watumiaji halisi ulikuwa muhimu kwa umuhimu wa kazi.

4. Technical Details & Analysis

4.1. Core Insight & Logical Flow

Core Insight: Uhakiki wa msingi wa karatasi hiyo ni kwamba kikwazo kikubwa kwa wasomaji wa EFL wa hali ya juu sio kutafuta msamiati, bali utatanishi wa muktadha na uchanganuzi wa kisintaksia. Zana kama kamusi zinatatua "nini" (ufafanuzi); Reading.help inalenga kutatua "kwa nini" na "jinsi"—kwa nini neno hili hapa, jinsi kishazi hiki kinavyobadilisha nomino hiyo. Mtiririko wa kimantiki ni mzuri: 1) Tambua sehemu zenye uwezekano wa kusababisha ugumu (Moduli ya Utambuzi), 2) Toa maelezo ya kielimu (Primary LLM), 3) Hakiki maelezo hayo kwa uangalifu (Secondary LLM), 4) Wasilisha kupitia UI isiyo-vurugu, inayounganishwa na mihighlight. Hii inaunda mfumo wa kitanzi kilichofungwa unaolenga ujenzi wa uelewa badala ya tafsiri.

4.2. Strengths & Critical Flaws

Nguvu:

  • Utaratibu Mpya wa Uthibitishaji: Usanidi wa LLM-mbili ni ujanja wa gharama nafuu kwa udhibiti wa ubora. Unakubua tatizo la "kasuku anayebadilika-badilika" moja kwa moja, tofauti na matumizi mengi ya LLM yanayotozoa matokeo kama injili.
  • Upeo wa Tatizo Unaofaa: Kulenga wasomaji wa kiwango cha chuo kikuu kunazuia ugumu mkubwa wa kukabiliana na viwango vyote vye uwezo. Ni soko linaloweza kustahimili la kuanzia.
  • Uaminifu wa UI: Vipengele vya kiolesura (A-H) vinaonyesha ujumuishaji wa kina wa zana za usaidizi moja kwa moja katika mchakato wa usomaji, na hivyo kupunguza mzigo wa utambuzi unaohitaji kubadilishana.
Kasoro Muhimu:
  • Tathmini ya Sanduku Nyeusi: Udhaifu mkubwa wa karatasi hii ni tathmini. N=5 watumiaji na wataalamu 2 ni hadithi, sio ya kihalisi. Vipimo vya kiasi viko wapi? Alama za faida ya uelewa? Usawa wa kasi na usahihi? Ikilinganishwa na msingi (k.m., kutumia kamusi)? Ukosefu huu wa uthibitisho mkali unadhoofisha sana ufanisi uliodaiwa.
  • Ugunduzi wa "Ugumu" usio wazi: Moduli ya Utambulisho imeelezewa kwa maneno yasiyo wazi. "Maudhui yanayoweza kuwa magumu" yanafafanuliwa na kuigwa vipi? Bila uwazi, haiwezekani kutathmini usahihi wake au upendeleo.
  • Scalability & Cost: Kuendesha LLMs mbili kwa kila ombi la ufafanuzi huongeza gharama na ucheleweshaji wa inference maradufu. Kwa msaidizi wa usomaji wa wakati halisi, hii inaweza kuwa kikwazo kinachozuia uwezo wa kupanua.

4.3. Actionable Insights & Strategic Implications

Kwa Watafiti: Kazi hii ni mpango mfano wa usanidi wa LLM wenye uwajibikaji na usaidiziMuundo wa LLM-mbili unapaswa kuwekwa kiwango kwa AI ya elimu. Kazi ya baadaye lazima ibadilishe tathmini dhaifu na utafiti thabiti wa kulinganisha watumiaji (majaribio ya A/B dhidi ya zana zilizothibitishwa) na viwango vya tathmini ya EFL (k.m., vilivyobadilishwa kutoka sehemu za kusoma za TOEFL au IELTS).

Kwa Watengenezaji wa Bidhaa: Kipengele cha kuonyesha kikamilifu ndicho programu bora. Kinabadilisha zana kutoka kwa kukabiliana hadi kutarajia. Njia ya bidhaa ya haraka inapaswa kulenga: 1) Kuboresha mfuatano wa LLM-mbili kwa kasi (labda kutumia modeli ndogo na ya haraka kwa uthibitishaji), 2) Kubinafsisha ugunduzi wa "ugumu" kulingana na historia ya mwingiliano wa mtumiaji binafsi, na 3) Kuchunguza modeli ya freemium ambapo vielelezo vya msingi ni bure, lakini maelezo ya kina ya sarufi ni ya hali ya juu.

Athari Pana: Reading.help inawakilisha mabadiliko kutoka Tafsiri ya Mashine hadi Machine TutoringLengo sio kuchukua nafasi ya maandishi asilia, bali ni kumwandaa msomaji kuyashinda. Hii inalingana na mielekeo mikubwa ya "AI kwa Uboreshaji" kuliko "AI kwa Otomatiki," kama ilivyojadiliwa katika utafiti kutoka Taasisi ya Stanford ya AI Inayolenga Binadamu. Ikiwa itafanikiwa, njia hii inaweza kutumika kwa aina nyingine ngumu za hati kama mikataba ya kisheria au karatasi za kisayansi kwa wasio wataalamu.

5. Uchambuzi wa Asili: Zaidi ya Kiolesura

Reading.help iko kwenye makutano ya kuvutia ya mienendo mikubwa mitatu: usambazaji wa ujifunzaji wa lugha, ukamilifu wa LLMs maalum kwa kazi, na msisitizo unaozidi kuongezeka kwenye ushirikiano wa binadamu na AI. Ingawa karatasi hiyo inawasilisha uchunguzi wa kesi unaovutia, umuhimu wake wa kweli uko katika mfumo wa mbinu unaodokeza kwa ajili ya kujenga AI ya elimu inayoweza kuaminika. Utaratibu wa uthibitishaji wa LLM-mbili, ingawa wa gharama kubwa kwa hesabu, ni jibu la moja kwa moja kwa mojawapo ya vikwazo vinavyotajwa zaidi vya AI ya uzalishaji katika elimu: mwelekeo wake wa kutokuwa sahihi kwa ujasiri. Hii inalingana na wasiwasi ulioibuliwa katika tafiti kuhusu uwongo wa LLM, kama zile zilizorekodiwa na OpenAI na katika uchunguzi kama "On the Dangers of Stochastic Parrots" (Bender et al., 2021). Kwa kutekeleza hatua ya uthibitishaji, waandishi kimsingi wanajenga aina ya msingi ya "AI ya kikatiba," ambapo matokeo ya modeli moja yanazuiliwa na ukaguzi wa nyingine, dhana inayopata umaarufu kwa ajili ya utafiti wa ulinganifu.

Hata hii, utafiti haujafafanua kipimo chake cha msingi: ni nini kinachounda "usaidizi wa kusoma wenye mafanikio"? Je, ni kasi ya kusoma, uelewa wa kina, uhifadhi wa msamiati ulioongezeka, au tu ujasiri wa mtumiaji? Uwanja wa mifumo ya ufundishaji yenye akili (ITS) umekuwa ukishughulika na hili kwa muda mrefu, mara nyingi ukikitumia mafanikio ya mtihani kabla na baada ya kama kiwango cha dhahabu. Zana kama Reading.help inaweza kufaidika kwa kuunganishwa na mifumo ya tathmini ya uelewa wa kusoma iliyothibitishwa. Zaidi ya hayo, mwelekeo kwa wasomaji wa Kikorea wa Kifasihi cha Kigeni (EFL), huku ukitoa muktadha wa kitamaduni wenye thamani, unaleta maswali kuhusu uwezekano wa kujumlisha. Changamoto za kisarufi za Kiingereza hutofautiana kwa kiasi kikubwa kati ya wazungumzaji wa lugha ya kitu-kitenzi-kisimuli (SOV) kama Kikorea na lugha ya kitu-kisimuli-kitenzi (SVO) kama Kihispania. Matoleo ya baadaye yanahitaji muundo wa utambuzi wa ugumu wenye ufahamu wa lugha na uelewa zaidi, labda unaojulikana na uchambuzi wa kulinganisha kutoka kwa utafiti wa upatikanaji wa lugha ya pili.

Ikilinganisha na zana zingine za usomaji zilizoboreshwa, kama vile "Read Along" ya Google iliyokwisha sasa au mifano ya utafiti kama "Lingolette," nguvu ya Reading.help ni ufinyu wake—inatoa usaidizi kiwango cha neno, kishazi, na aya. Hata hivyo, ina hatari ya kuunda athari ya "kigongo" ikiwa maelezo yanapatikana kwa urahisi sana. Ubadilishaji unaofuata unapaswa kujumuisha kupungua kwa kukabiliana, ambapo mfumo hupunguza hatua kwa hatua vidokezi vya makini kadiri mtumiaji anavyoonyesha ujuzi wa miundo fulani ya kisarufi au vitu vya msamiati, kanuni inayotokana na usanifu wa mwalimu wa utambuzi. Mwishowe, Reading.help ni uthibitisho-mkakati unaotumainiwa unaoangazia uwezo mkubwa na changamoto zisizo ndogo za kuweka LLMs kama wakufunzi binafsi wa usomaji.

6. Technical Framework & Mathematical Model

Ingawa PDF haielezi kwa kina algoriti maalum, mfumo ulioelezewa unamaanisha sehemu kadhaa za kiufundi za msingi. Tunaweza kuweka kanuni mchakato mkuu.

1. Ukadiriaji wa Alama ya Ugumu: Moduli ya Utambuzi inaweza kupeana alama ya ugumu $d_i$ kwa kipande cha maandishi (neno, kishazi, sentensi) $t_i$. Hii inaweza kutegemea muundo mchanganyiko:

2. Mantiki ya Uthibitishaji wa LLM-Mbili: Acha $\text{LLM}_G$ iwe kizazi na $\text{LLM}_V$ iwe mthibitishaji. Kwa swali la kuingiza $q$ (k.m., "Eleza sentensi hii"), mchakato ni:

7. Experimental Results & Chart Description

Maandishi ya PDF yaliyotolewa hayajumuishi matokeo ya kina ya kiasi au chati. Tathmini imeelezewa kwa ubora:

  • Sample: Tathmini ya mwisho na wasomaji 5 wa EFL na wataalamu 2.
  • Mbinu: Uwezekano wa mahojiano ya ubora au majaribio ya utumiaji baada ya mwingiliano na zana.
  • Implied Chart/Figure: Figure 1 katika karatasi ni mchoro wa kiolesura cha mfumo, unaonyesha vipengele (A) hadi (H) kama vilivyowekwa lebo katika maudhui ya PDF. Inaonyesha kwa macho ushirikishwaji wa paneli za muhtasari, menyu za zana, uangaziaji, na vifungu vya maelezo ndani ya dirisha moja la kusomea.
  • Reported Outcome: Matokeo yapendekeza zana hiyo inaweza kusaidia wasomaji wa EFL kujifunza wakati usaidizi wa nje haupo. Hakuna vipimo vya takwimu vya uboreshaji (k.m.v., alama za mtihani wa ufahamu, kupunguzwa kwa muda-wa-kazi) zilizoripotiwa.
Ukosefu huu wa data ya kiasi ni kikwazo kikubwa katika kutathmini athari ya zana hii.

8. Mfumo wa Uchambuzi: Kesi ya Matumizi Isiyo ya Msimbo

Fikiria mtafiti wa EFL au meneja wa bidhaa anayetaka kuchambua ufanisi wa kipengele kama "kuangazia kwa ukakamali." Bila kupata msimbo, anaweza kutumia mfumo huu wa uchambuzi:

Kesi: Tathmini ya moduli ya "Ugumu wa Kugundua".

  1. Fafanua Vipimo vya Mafanikio: "Kivurini" chema kinamaanisha nini? Ufafanuzi unaowezekana wa kiutendaji:
    • Usahihi: Kati ya maandishi yote yaliyokuriniwa na mfumo, asilimia ngapi walibofya watumiaji ili kupata usaidizi? (Usahihi wa juu unamaanisha vivurio vina muktadha).
    • Ukumbusho: Kati ya sehemu zote za maandishi ambazo watumiaji walichagua kwa mikono kwa msaada, ni asilimia ngapi zilikuwa zimeangaziwa kikamilifu? (Ukumbusho wa juu unamaanisha mfumo unatarajia mahitaji mengi).
    • Uridhishaji wa Mtumiaji: Ukadiriaji wa utafiti baada ya kikao (1-5) kwenye taarifa "Viangazio vilinivutia kwenye maeneo niliyoyapata kuwa magumu."
  2. Ukusanyaji wa Data: Rekodi mwingiliano wote wa mtumiaji: mionyesho ya mfumo (pamoja na alama zao $d_i$), kubofya kwa mtumiaji kwenye mionyesho, uteuzi wa maandishi wa mikono ya mtumiaji nje ya mionyesho.
  3. Uchambuzi: Calculate Precision na Recall for different $d_i$ thresholds. For example, if the system only highlights items with $d_i > 0.7$, does precision improve? Plot a Precision-Recall curve hadi find the optimal threshold that balances relevance na coverage.
  4. Rudia. Tumia matokeo ya utafiti kurekebisha viwango ($\alpha, \beta, \gamma$) katika muundo wa alama ya ugumu, au kuongeza vipengele vipya (k.m., kusisitiza marejeleo ya kitamaduni).
Mfumo huu unabadilisha kipengele cha kisanduku nyeusi kuwa mfumo unaoweza kuchanganuliwa kwa kutumia data ya mwingiliano, ukiongoza uboreshaji wa kurudia bila kuhitaji msimbo wa muundo.

9. Future Applications & Development Directions

The Reading.help paradigm opens several promising avenues:

  • Vertical-Specific Assistants: Badilisha injini ya msingi kusoma karatasi za kisayansi, hati za kisheria, au maagizo ya kiufundi kwa wasomaji wataalamu wasio wenyeji. Moduli ya utambuzi itahitaji mkusanyiko wa ugumu maalum wa kikoa.
  • Ujumuishaji wa Njia Nyingi: Unganisha uchambuzi wa maandishi na usanisi wa usemi ili kuunda msaidizi wa kusoma kwa sauti anayeelezea sehemu ngumu anaposimulia, ikisaidia uelewa wa kusikiliza.
  • Uundaji wa Mfano wa Mwanafunzi wa Muda Mrefu: Badilisha zana kutoka kwa msaidizi wa msingi wa kipindi hadi mwenzi wa kujifunza maisha yote. Fuatilia dhana za kisarufi ambazo mtumiaji hutafuta msaada kila wakati na uzalisha mazoezi ya kukariri yanayolenga binafsi, na kuunda mzunguko wa kujifunza uliofungwa.
  • Uhamishaji wa Lugha Mbalimbali: Kwa lugha zilizo na rasilimali sawa, tumia usanifu sawa ili kusaidia wasomaji wa maandishi ya Kichina, Kiarabu, au Kihispania. Uthibitishaji wa LLM-mbili ungekuwa muhimu sawa.
  • Ushirikiano na Kujifunza Rasmi: Shirikiana na majukwaa ya kujifunza mtandaoni (Coursera, EdX) au wachapishaji wa vitabu vya kidijitali ili kuingiza utendakazi wa Reading.help moja kwa moja kwenye nyenzo za kozi, kutoa usaidizi wa wakati huswa kwa wanafunzi waliosajiliwa.
  • Mbinu za Uthibitishaji wa Juu: Badilisha au ongeza uthibitishaji wa LLM wa pili kwa njia bora zaidi: vihakiki vya kanuni za sarufi, utafutaji wa grafu ya maarifa kwa uthabiti wa ukweli, au mfano mdogo, uliokolezwa wa "mkosoaji" ulioboreshwa mahsusi kwa uthibitishaji wa maelezo.
Lengo la mwisho ni kiunzi cha usomaji kinachobadilika, kinachotambua muktadha, ambacho si tu husaidia kuelewa bali pia huharakisha upatikanaji wa lugha.

10. References

  1. Chung, S., Jeon, H., Shin, S., & Hoque, M. N. (2025). Reading.help: Supporting EFL Readers with Proactive na On-Demand Explanation of English Grammar na Semantics. arXiv preprint arXiv:2505.14031v2.
  2. Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021). On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜. In Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency (uk. 610–623).
  3. Anderson, J. R., Corbett, A. T., Koedinger, K. R., & Pelletier, R. (1995). Cognitive Tutors: Lessons Learned. The Journal of the Learning Sciences, 4(2), 167–207.
  4. Stanford Institute for Human-Centered Artificial Intelligence (HAI). (2023). The AI Index 2023 Annual Report. Retrieved from https://hai.stanford.edu/research/ai-index-2023
  5. Nation, I. S. P. (2001). Kujifunza Msamiati Katika Lugha Nyingine. Cambridge University Press.
  6. Google. (n.d.). Google Translate. Imepatikana kutoka https://translate.google.com
  7. Council of Europe. (2001). Common European Framework of Reference for Languages: Learning, teaching, assessment. Cambridge University Press.