1. परिचय
शब्दावली का आकार भाषा प्रवीणता का एक मौलिक स्तंभ है, जो पठन समझ, श्रवण कौशल और समग्र संचार दक्षता से मजबूती से संबंधित है। ग्रहणात्मक (समझना) और उत्पादक (उपयोग करना) शब्दावली के बीच अंतर महत्वपूर्ण है, जिसमें अधिकांश मानकीकृत परीक्षण पठन और श्रवण के माध्यम से भाषा अर्जन में इसकी आधारभूत भूमिका के कारण पूर्व पर केंद्रित होते हैं। यह शोध पत्र पोलिश शब्दावली आकार परीक्षण (पीवीएसटी) के पायलट विकास का परिचय देता है, जो एक अनुकूली उपकरण है जिसे मूल और गैर-मूल पोलिश वक्ताओं दोनों की ग्रहणात्मक शब्दावली की चौड़ाई को विश्वसनीय रूप से मापने के लिए डिज़ाइन किया गया है। इसके मुख्य उद्देश्य इन समूहों के बीच प्रभावी ढंग से अंतर करना और मूल वक्ताओं के बीच शब्दावली आकार और आयु के बीच अपेक्षित सहसंबंध स्थापित करना हैं।
2. साहित्य समीक्षा
शब्दावली मूल्यांकन का क्षेत्र कई स्थापित पद्धतियों से प्रभावित है, जिनमें से प्रत्येक की अपनी ताकत और प्रलेखित सीमाएँ हैं।
2.1 शब्दावली आकार परीक्षण
पारंपरिक विधियों में कागज-कलम कार्य, बुद्धि परीक्षणों के उपपैमाने (जैसे, वेक्सलर), पीबॉडी चित्र शब्दावली परीक्षण और शब्दावली स्तर परीक्षण शामिल हैं। वर्तमान में, दो सबसे प्रमुख हैं:
- शब्दावली आकार परीक्षण (वीएसटी): आवृत्ति-आधारित शब्द समूहों का उपयोग करता है जहाँ परीक्षार्थी बहुविकल्पी विकल्पों में से समानार्थी या परिभाषाएँ चुनते हैं। इसे कई भाषाओं के लिए अनुकूलित किया गया है।
- लेक्सटेल: एक शाब्दिक निर्णय कार्य जहाँ प्रतिभागी यह निर्णय लेते हैं कि कोई अक्षर-स्ट्रिंग एक वास्तविक शब्द है या एक छद्मशब्द। इसका कई यूरोपीय और एशियाई भाषाओं में अनुवाद किया गया है।
2.2 मौजूदा परीक्षणों की सीमाएँ
इन मुख्यधारा के परीक्षणों की आलोचनाएँ महत्वपूर्ण हैं। वीएसटी के बहुविकल्पी प्रारूप के कारण अनुमान लगाकर अंकों में वृद्धि होने की संभावना है, जिससे वास्तविक शब्दावली ज्ञान का अधिमूल्यांकन हो सकता है। लेक्सटेल को इसकी विश्वसनीयता के अतिरंजित बयान और स्वतंत्र पुनरावृत्ति अध्ययनों की कमी के संबंध में आलोचना का सामना करना पड़ा है, जिससे द्वितीय भाषा प्रवीणता में स्तरीकरण के प्रति इसकी संवेदनशीलता पर प्रश्न उठते हैं।
2.3 कंप्यूटरीकृत अनुकूली परीक्षण (सीएटी)
एक उभरता हुआ और शक्तिशाली विकल्प कंप्यूटरीकृत अनुकूली परीक्षण (सीएटी) है, जो आइटम प्रतिक्रिया सिद्धांत (आईआरटी) पर आधारित है। सीएटी की मुख्य नवीनता यह है कि यह पिछले आइटमों पर परीक्षार्थी के प्रदर्शन के आधार पर प्रत्येक अगले परीक्षण आइटम का गतिशील चयन करता है। यह वास्तविक समय में व्यक्ति की क्षमता स्तर के अनुरूप परीक्षण की कठिनाई को अनुकूलित करता है, जिससे परीक्षण छोटे, अधिक सटीक और संज्ञानात्मक रूप से कम थकाने वाले होते हैं। एक सफल पूर्व उदाहरण रूसी के लिए अनुकूली ऑनलाइन शब्दावली आकार परीक्षण (एओवीएसटी) है, जिसने उच्च वैधता और मापनीयता प्रदर्शित की।
3. पोलिश शब्दावली आकार परीक्षण (पीवीएसटी)
पीवीएसटी को स्थैतिक परीक्षणों की सीमाओं को दूर करने के उद्देश्य से पोलिश भाषा के लिए सीएटी और आईआरटी सिद्धांतों के एक नए अनुप्रयोग के रूप में स्थापित किया गया है।
3.1 पद्धति एवं डिज़ाइन
परीक्षण को एक वेब-आधारित अनुकूली मूल्यांकन के रूप में डिज़ाइन किया गया है। यह गतिशील रूप से शब्द प्रस्तुत करता है (संभवतः आवृत्ति-क्रमित कोष से चयनित) और परीक्षार्थी से परिभाषा मिलान या समानार्थी चयन के माध्यम से ग्रहणात्मक ज्ञान प्रदर्शित करने की आवश्यकता होती है। आईआरटी एल्गोरिदम प्रत्येक प्रतिक्रिया के बाद प्रतिभागी की शब्दावली क्षमता ($\theta$) का अनुमान लगाता है और अगला शब्द चुनता है जिसकी कठिनाई पैरामीटर वर्तमान क्षमता अनुमान से सबसे अच्छी तरह मेल खाती है।
3.2 तकनीकी कार्यान्वयन
एओवीएसटी ढाँचे पर आधारित, पीवीएसटी बैकएंड आइटम कठिनाई को अंशांकित करने और प्रतिभागी क्षमता का अनुमान लगाने के लिए एक आईआरटी मॉडल (जैसे, 1- या 2-पैरामीटर लॉजिस्टिक मॉडल) लागू करता है। फ्रंटएंड शब्द प्रस्तुति और प्रतिक्रिया संग्रह के लिए एक सुव्यवस्थित उपयोगकर्ता इंटरफ़ेस प्रदान करता है। सिस्टम को बड़े पैमाने पर डेटा संग्रह को संभालने के लिए मापनीयता के लिए इंजीनियर किया गया है।
4. पायलट परिणाम एवं विश्लेषण
पायलट अध्ययन का उद्देश्य पीवीएसटी के मूल परिकल्पनाओं को मान्य करना था। प्रारंभिक परिणामों से यह दिखने की अपेक्षा है:
- मूल और गैर-मूल पोलिश वक्ता समूहों के बीच पीवीएसटी अंकों में एक स्पष्ट और सांख्यिकीय रूप से महत्वपूर्ण अंतर।
- मूल पोलिश वक्ताओं के बीच पीवीएसटी अंकों और आयु के बीच एक मजबूत, अरेखीय सकारात्मक सहसंबंध, जो डच, अंग्रेजी और जर्मन अध्ययनों के निष्कर्षों के अनुरूप है।
- उच्च विश्वसनीयता मापदंड (जैसे, परीक्षण-पुनः परीक्षण विश्वसनीयता) और रचना वैधता के प्रमाण।
चार्ट विवरण: एक काल्पनिक बिखराव आरेख मूल वक्ताओं के लिए आयु (एक्स-अक्ष) और अनुमानित शब्दावली आकार (वाई-अक्ष) के बीच सहसंबंल्ल को दर्शाएगा। आरेख प्रारंभिक वर्षों में एक तीव्र सकारात्मक प्रवृत्ति दिखाएगा, जो वयस्कता में स्थिर हो जाएगी, जिसमें मूल वक्ता डेटा बिंदु वाई-अक्ष पर गैर-मूल वक्ता डेटा बिंदुओं की तुलना में काफी ऊँचे समूहित होंगे, जो एक अलग समूह में दिखाए जाएंगे।
5. मूल अंतर्दृष्टि एवं विश्लेषक परिप्रेक्ष्य
मूल अंतर्दृष्टि: पीवीएसटी केवल एक और शब्दावली परीक्षण नहीं है; यह स्थैतिक, सर्व-उपयुक्त मूल्यांकनों से गतिशील, व्यक्तिगत माप की ओर एक रणनीतिक परिवर्तन है। इसका वास्तविक मूल्य केवल दक्षता के लिए नहीं, बल्कि जनसंख्या स्तर पर पोलिश मानसिक शब्दकोश में सूक्ष्म, डेटा-संचालित अंतर्दृष्टि को अनलॉक करने के लिए आईआरटी और सीएटी का लाभ उठाने में निहित है। यह क्षेत्र को वर्णनात्मक स्कोरिंग से भाषा अर्जन प्रक्षेपवक्रों के भविष्य कथन मॉडलिंग की ओर ले जाता है।
तार्किक प्रवाह: लेखक वीएसटी और लेक्सटेल जैसे पुराने परीक्षणों की सीमा प्रभाव और अनुमान लगाने की कमियों की सही पहचान करते हैं। उनका समाधान वास्तुशिल्प रूप से मजबूत है: एओवीएसटी से सिद्ध सीएटी/आईआरटी ढाँचे को अपनाएं, जिसने 400,000 से अधिक प्रतिक्रियाओं के साथ मजबूती प्रदर्शित की है, और इसे अपर्याप्त सेवा प्राप्त पोलिश भाषाई क्षेत्र पर लागू करें। तर्क आविष्कार के बजाय रणनीतिक, उच्च-निष्ठा पुनरावृत्ति और स्थानीयकरण के बारे में अधिक है।
ताकत एवं कमियाँ: प्रमुख ताकत पद्धतिगत कठोरता है। सीएटी का उपयोग परीक्षण लंबाई और सटीकता के महत्वपूर्ण दर्द बिंदुओं को सीधे संबोधित करता है। हालाँकि, पायलट की सफलता पूरी तरह से आइटम बैंक अंशांकन की गुणवत्ता पर निर्भर करती है। शब्द कठिनाई का एक दोषपूर्ण या पक्षपातपूर्ण प्रारंभिक अंशांकन पूरे अनुकूली प्रणाली में त्रुटियों को प्रसारित करेगा। पेपर की वर्तमान कमजोरी प्रकट पायलट डेटा की कमी है; मूल/गैर-मूल वक्ताओं के बीच अंतर और आयु सहसंबंध के दावे अनुभवजन्य परिणाम प्रकाशित और जाँचे जाने तक वादे के रूप में रहते हैं, जो कंप्यूटर विज़न में व्यापक रूप से मान्य मॉडल जैसे साइकलजीएएन (झू एट अल., 2017) के विपरीत है, जिसने स्पष्ट, पुनरुत्पादन योग्य छवि अनुवाद परिणाम प्रस्तुत किए।
कार्रवाई योग्य अंतर्दृष्टि: शोधकर्ताओं के लिए, तत्काल कदम आइटम प्रतिक्रिया डेटा और अंशांकन पैरामीटर में पारदर्शिता की मांग करना है। शिक्षकों और भाषा प्रौद्योगिकी डेवलपर्स के लिए, पीवीएसटी ढाँचा एक खाका प्रस्तुत करता है। मूल सीएटी इंजन को अमूर्त किया जा सकता है और अन्य भाषाई विशेषताओं (व्याकरण, सहचरित शब्द) या यहाँ तक कि अन्य भाषाओं पर लागू किया जा सकता है, जिससे अनुकूली निदानों का एक समूह बनाया जा सके। प्राथमिकता परीक्षण इंजन या एपीआई को ओपन-सोर्स करना होना चाहिए, जीथब या हगिंग फेस जैसे प्लेटफार्मों पर होस्ट किए गए टूल्स के मॉडल का पालन करते हुए, ताकि समुदाय मान्यता और तीव्र पुनरावृत्ति को बढ़ावा दिया जा सके, न कि इसे एक बंद शैक्षणिक उपकरण बनाए रखा जाए।
6. तकनीकी विवरण एवं गणितीय ढाँचा
पीवीएसटी आइटम प्रतिक्रिया सिद्धांत (आईआरटी) द्वारा समर्थित है। क्षमता $\theta$ वाले व्यक्ति द्वारा आइटम $i$ का सही उत्तर देने की संभावना एक लॉजिस्टिक फ़ंक्शन द्वारा मॉडल की जाती है। एक सामान्य मॉडल 2-पैरामीटर लॉजिस्टिक (2पीएल) मॉडल है:
$P_i(\theta) = \frac{1}{1 + e^{-a_i(\theta - b_i)}}$
जहाँ:
- $P_i(\theta)$: आइटम $i$ के लिए सही प्रतिक्रिया की संभावना।
- $\theta$: परीक्षार्थी का अव्यक्त गुण (शब्दावली क्षमता)।
- $a_i$: आइटम $i$ का विभेदन पैरामीटर (आइटम क्षमताओं के बीच कितनी अच्छी तरह अंतर करता है)।
- $b_i$: आइटम $i$ का कठिनाई पैरामीटर (वह क्षमता स्तर जिस पर सही प्रतिक्रिया की 50% संभावना होती है)।
सीएटी एल्गोरिदम प्रत्येक प्रतिक्रिया के बाद $\hat{\theta}$ के अनुमान को अद्यतन करने के लिए अधिकतम संभावना अनुमान (एमएलई) या बायेसियन अनुमान (जैसे, अपेक्षित पश्चगामी) का उपयोग करता है। अगला आइटम बैंक से चुना जाता है ताकि उसकी कठिनाई $b_j$ वर्तमान $\hat{\theta}$ के करीब हो, अगली प्रतिक्रिया द्वारा प्रदान की गई जानकारी को अधिकतम करते हुए: $I_j(\theta) = [P'_j(\theta)]^2 / [P_j(\theta)(1-P_j(\theta))]$।
7. विश्लेषण ढाँचा: उदाहरण केस
परिदृश्य: मूल और गैर-मूल वक्ताओं के बीच विभेदक आइटम कार्यप्रणाली (डीआईएफ) का विश्लेषण करना।
ढाँचा:
- डेटा निष्कर्षण: सभी प्रतिभागी प्रतिक्रियाओं को लॉग करें (आइटम आईडी, प्रतिक्रिया शुद्धता, अनुमानित $\theta$, समूह लेबल: मूल/गैर-मूल)।
- समूह द्वारा आईआरटी पुनः अंशांकन: मूल और गैर-मूल डेटासेट के लिए अलग-अलग आइटम पैरामीटर ($a_i$, $b_i$) अंशांकित करें।
- डीआईएफ पहचान: दोनों समूहों में प्रत्येक आइटम के लिए कठिनाई पैरामीटर ($b_i$) की तुलना करें। एक सांख्यिकीय रूप से महत्वपूर्ण अंतर (जैसे, वाल्ड परीक्षण का उपयोग करके) डीआईएफ को इंगित करता है। उदाहरण के लिए, "przieg" (कोर्स/दौड़) जैसे शब्द के लिए दोनों समूहों के लिए समान $b$ हो सकता है, जबकि एक सांस्कृतिक रूप से विशिष्ट शब्द जैसे „śmigus-dyngus” (ईस्टर परंपरा) समग्र क्षमता को नियंत्रित करते हुए मूल वक्ताओं के लिए काफी आसान और गैर-मूल वक्ताओं के लिए कठिन हो सकता है।
- व्याख्या: बड़े डीआईएफ वाले आइटमों को चिह्नित किया जा सकता है। उन्हें मिश्रित समूहों के लिए मूल क्षमता अनुमान से हटाया जा सकता है या अलग परीक्षण मानदंड बनाने के लिए उपयोग किया जा सकता है, जिससे निष्पक्षता सुनिश्चित हो। यह प्रक्रिया मशीन लर्निंग मॉडलों में निष्पक्षता ऑडिट को दर्पण करती है, यह सुनिश्चित करते हुए कि परीक्षण किसी एक जनसंख्या के खिलाफ पक्षपाती नहीं है।
8. भविष्य के अनुप्रयोग एवं दिशाएँ
पीवीएसटी ढाँचा कई आशाजनक राहें खोलता है:
- अनुदैर्ध्य ट्रैकिंग: द्वितीय भाषा सीखने वालों में शब्दावली वृद्धि को मॉडल करने के लिए नियमित अंतराल पर पीवीएसटी को तैनात करना, अर्जन की दर और स्थिरता बिंदुओं पर सूक्ष्म डेटा प्रदान करना।
- नैदानिक उपकरण एकीकरण: डिजिटल भाषा सीखने के प्लेटफार्मों (जैसे डुओलिंगो या बैबेल) में अनुकूली परीक्षण को एम्बेड करना, ताकि व्यक्तिगत शब्दावली निदान प्रदान किए जा सकें और लक्षित शिक्षण सामग्री की सिफारिश की जा सके।
- अंतर-भाषाई शोध: कई भाषाओं में समानांतर पीवीएसटी-शैली के परीक्षणों का उपयोग करके शाब्दिक अर्जन, द्वितीय भाषा शब्दावली आकार पर प्रथम भाषा के प्रभाव और द्विभाषावाद के संज्ञानात्मक प्रभावों के बारे में मौलिक प्रश्नों की जांच करना।
- नैदानिक अनुप्रयोग: नैदानिक आबादी में भाषा विकारों (जैसे, वाचाघात, डिस्लेक्सिया) की जांच और निगरानी के लिए परीक्षण सिद्धांत को अनुकूलित करना, जहाँ कुशल और सटीक मूल्यांकन महत्वपूर्ण है।
- एआई एवं एनएलपी मॉडल मूल्यांकन: कठोरता से अंशांकित मानव शब्दावली डेटा पोलिश पर फाइन-ट्यून किए गए बड़े भाषा मॉडल (एलएलएम) के "शाब्दिक ज्ञान" के मूल्यांकन के लिए एक बेंचमार्क के रूप में कार्य कर सकता है, यह पूछते हुए कि क्या शब्द कठिनाई की मॉडल की "समझ" मानव मनोभाषाई डेटा के साथ संरेखित होती है।
9. संदर्भ
- Brysbaert, M. (2013). LexTALE_FR: A fast, free, and efficient test to measure language proficiency in French. Psychological Belgica.
- Coxhead, A., et al. (2014). The problem of guessing in multiple-choice vocabulary tests. Language Testing.
- Golovin, G. (2015). Adaptive online Vocabulary Size Test (AoVST) for Russian.
- Laufer, B., & Nation, P. (2001). Passive vocabulary size and speed of meaning recognition. Studies in Second Language Acquisition.
- Lemhöfer, K., & Broersma, M. (2012). Introducing LexTALE: A quick and valid lexical test for advanced learners of English. Behavior Research Methods.
- Nation, I.S.P., & Beglar, D. (2007). A vocabulary size test. The Language Teacher.
- Stoeckel, T., et al. (2021). The challenge of measuring vocabulary size. Language Assessment Quarterly.
- Webb, S. (2021). The Routledge Handbook of Vocabulary Studies.
- Zhu, J.-Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. Proceedings of the IEEE International Conference on Computer Vision (ICCV).