Polonya Kelime Dağarcığı Büyüklüğü Testi: Alıcı Kelime Değerlendirmesi için Yeni Bir Uyarlanabilir Test

1. İçindekiler

2. Giriş
3. Literatür Taraması
- 3.1 Kelime Dağarcığı Büyüklüğü Testleri
- 3.2 Bilgisayar Uyarlamalı Test (CAT)
4. Yöntem
- 4.1 Test Tasarımı ve Madde Seçimi
- 4.2 Katılımcılar ve Prosedür
5. Bulgular
- 5.1 Kelime Dağarcığı Büyüklüğü Dağılımı
- 5.2 Yaş ve Kelime Dağarcığı İlişkisi
6. Tartışma
7. Özgün Analiz
8. Teknik Detaylar
9. Deneysel Sonuçlar ve Şekiller
10. Analitik Çerçeve Örneği
11. Gelecekteki Uygulamalar ve Yönelimler
12. Kaynakça
13. Uzman Yorumu

2. Giriş

Kelime dağarcığı büyüklüğü, okuduğunu anlama, dinleme verimliliği ve kelime tanıma hızını etkileyen, dil yeterliliğinin temel taşlarından biridir. Polonya Kelime Dağarcığı Büyüklüğü Testi (PVST), hem anadili Polonyaca olan hem de olmayan konuşmacıların alıcı kelime dağarcığını değerlendirmek için Madde Tepki Kuramı'na (IRT) dayalı yeni bir uyarlanabilir yaklaşım sunar. Bu pilot çalışma, PVST'yi, Kelime Dağarcığı Büyüklüğü Testi (VST) ve LexTale gibi geleneksel sabit maddeli testlerin sınırlamalarını aşan, güvenilir ve zaman açısından verimli bir araç olarak doğrulamayı amaçlamaktadır.

3. Literatür Taraması

3.1 Kelime Dağarcığı Büyüklüğü Testleri

VST (Nation & Beglar, 2007) ve LexTale (Lemhöfer & Broersma, 2012) gibi geleneksel testler yaygın olarak kullanılmakla birlikte, tahmin yoluyla puan şişkinliği, tekrarlanabilirlik eksikliği ve yeterlilik seviyeleri arasında zayıf ayırt edicilik gibi sorunlardan muzdariptir. VST çoktan seçmeli eşanlamlı tanıma kullanırken, LexTale sözcüksel karar verme görevlerini kullanır. Her ikisi de birden çok dile uyarlanmış ancak güvenilirlik ve geçerlilik açısından kritik kusurlar göstermiştir.

3.2 Bilgisayar Uyarlamalı Test (CAT)

IRT'ye dayanan CAT, testi yapan kişinin önceki yanıtlarına göre maddeleri dinamik olarak seçerek hassasiyeti artırır ve test uzunluğunu azaltır. Golovin (2015), Rusça için Uyarlanabilir Çevrimiçi Kelime Dağarcığı Büyüklüğü Testi'ni (AoVST) geliştirmiş olup bu test, güçlü geçerlilik ve kelime dağarcığı ile yaş arasında doğrusal olmayan bir ilişki göstermiştir. PVST, bu metodolojiyi Polonyaca için temel alır.

4. Yöntem

4.1 Test Tasarımı ve Madde Seçimi

PVST, Rasch modeli kullanılarak kalibre edilmiş 500 Polonyaca kelimeden oluşan bir havuz kullanır. Maddeler, testi yapan kişinin tahmini yeteneğine göre uyarlanabilir bir şekilde seçilir ve her yanıt, maksimum olabilirlik tahmini yoluyla yetenek tahminini günceller. Test, tahminin standart hatası 0.3 logit'in altına düştüğünde sona erer.

4.2 Katılımcılar ve Prosedür

1.200 katılımcıdan (800 anadili Polonyaca olan, 400 anadili olmayan öğrenci) oluşan bir örneklem, PVST'yi çevrimiçi olarak tamamlamıştır. Anadili Polonyaca olanlar 18 ila 70 yaş arasında değişirken, anadili olmayanlar en az B1 yeterliliğine sahipti. Testin tamamlanması ortalama 12 dakika sürmüştür.

5. Bulgular

5.1 Kelime Dağarcığı Büyüklüğü Dağılımı

Anadili Polonyaca olanlar, ortalama 45.000 kelimelik (SS = 8.200) bir alıcı kelime dağarcığı gösterirken, anadili olmayanlar ortalama 18.000 kelime (SS = 5.400) elde etmiştir. Anadili konuşanlar için dağılım pozitif çarpıktı; genç yetişkinler (18-30) yaşlı yetişkinlerden (60+) daha yüksek puan almıştır.

5.2 Yaş ve Kelime Dağarcığı İlişkisi

Anadili Polonyaca olanlar için yaş ve kelime dağarcığı büyüklüğü arasında anlamlı bir doğrusal olmayan ilişki bulunmuştur (R² = 0.34, p < 0.001). Kelime dağarcığı 25-35 yaş aralığında zirve yapmış ve 50 yaşından sonra kademeli olarak azalmıştır. Bu durum, Keuleers ve ark. (2015) tarafından Felemenkçe için yapılan bulgularla uyumludur.

6. Tartışma

PVST, anadili Polonyaca olanları olmayanlardan başarıyla ayırmakta ve yaşa bağlı kelime dağarcığı eğilimlerini yakalamaktadır. Uyarlanabilir yapısı, yüksek güvenilirliği (Cronbach α = 0.92) korurken test süresini sabit uzunluktaki testlere kıyasla %40 oranında azaltmaktadır. Test, tahmin etkilerini en aza indirerek ve daha hassas yetenek tahminleri sağlayarak VST ve LexTale'e yöneltilen temel eleştirileri ele almaktadır.

7. Özgün Analiz

PVST, test verimliliği ve doğruluğu konusundaki uzun süredir devam eden sorunları ele almak için IRT tabanlı uyarlanabilir testlerden yararlanarak kelime dağarcığı değerlendirmesinde önemli bir metodolojik ilerlemeyi temsil etmektedir. Genellikle tahmin nedeniyle puanları şişiren geleneksel sabit maddeli testlerin (Coxhead ve ark., 2014) aksine, PVST'nin uyarlanabilir algoritması madde zorluğunu bireye göre uyarlayarak ölçüm hatasını azaltır. Bu yaklaşım, uyarlanabilir testlerin sabit testlerle aynı hassasiyeti %50 daha az maddeyle elde edebileceğini gösteren eğitimsel testlerdeki CAT araştırmalarıyla desteklenmektedir (Weiss, 2011). Anadili konuşanlarda yaş ve kelime dağarcığı büyüklüğü arasındaki güçlü korelasyon (R² = 0.34), İngilizce (Brysbaert ve ark., 2016) ve Felemenkçe (Keuleers ve ark., 2015) üzerine yapılan büyük ölçekli çalışmalarda gözlemlenen örüntüleri yansıtarak, kelime dağarcığı büyümesinin erken yetişkinlikte platoya ulaştığını ve ilerleyen yıllarda azaldığını doğrulamaktadır. Bununla birlikte, PVST'nin tek bir kelime tanıma biçimine dayanması, Read (2023) tarafından belirtilen bir sınırlama olan kelime bilgisi derinliğini yakalayamayabilir. Gelecekteki sürümler, daha bütünsel bir değerlendirme sağlamak için anlam hatırlama veya bağlamsal kullanım gibi birden çok yanıt biçimini içerebilir. Altta yatan IRT çerçevesinin dil bağımsız olması nedeniyle testin diller arası uyarlanma potansiyeli umut vericidir; bu, Rusça AoVST'de (Golovin, 2015) kullanılan yaklaşıma benzer. Pratik açıdan bakıldığında, PVST eğitimcilere ve araştırmacılara, yaşlanan popülasyonlarda dil gerilemesini değerlendirmek için klinik ortamlarda potansiyel uygulamaları olan, seviye belirleme testleri ve boylamsal çalışmalar için hızlı ve güvenilir bir araç sunmaktadır. Madde kalibrasyonunu iyileştirmek için makine öğrenimi modellerinin entegrasyonu, son dönemdeki uyarlanabilir dil değerlendirmelerinde gösterildiği gibi (Bohn ve ark., 2024) yordama geçerliliğini daha da artırabilir. Genel olarak PVST, Slav dillerinde kelime dağarcığı testi için yeni bir standart belirlemekte ve diğer yetersiz kaynaklı diller için tekrarlanabilir bir model sunmaktadır.

8. Teknik Detaylar

PVST, madde kalibrasyonu için Rasch modelini kullanır; burada doğru yanıt olasılığı şu şekilde verilir:

$P(X_{ij}=1|\theta_i, b_j) = \frac{e^{(\theta_i - b_j)}}{1 + e^{(\theta_i - b_j)}}$

burada $\theta_i$, $i$ bireyinin yeteneği ve $b_j$, $j$ maddesinin zorluğudur. Test, mevcut yetenek tahmininde bilgiyi en üst düzeye çıkaran bir sonraki maddeyi seçmek için Bayesçi bir uyarlanabilir algoritma kullanır. Durdurma kuralı, SE < 0.3 logit olarak ayarlanan $\theta$'nın standart hatasına dayanır.

9. Deneysel Sonuçlar ve Şekiller

Şekil 1: Anadili Polonyaca olan (mavi) ve olmayan (kırmızı) konuşmacılar için kelime dağarcığı büyüklüğü dağılımı. Anadili konuşanlar, 45.000 civarında bir zirve ile daha geniş bir aralık (20.000-70.000 kelime) gösterirken, anadili olmayanlar 10.000-30.000 kelime arasında kümelenmiştir.

Şekil 2: Anadili Polonyaca olanlar için yaş ve kelime dağarcığı büyüklüğü arasındaki dağılım grafiği; loess düzgünleştirme eğrisi, 30 yaşında bir zirve ve 55 yaşından sonra kademeli bir düşüş göstermektedir. Doğrusal olmayan uyum (R² = 0.34), yaşın kelime dağarcığı büyüklüğündeki varyansın %34'ünü açıkladığını göstermektedir.

Tablo 1: Test özelliklerinin karşılaştırması: PVST (12 dk, ortalama 30 madde, α=0.92) vs. VST (25 dk, 140 madde, α=0.88) vs. LexTale (15 dk, 60 madde, α=0.85). PVST üstün verimlilik ve güvenilirlik göstermektedir.

10. Analitik Çerçeve Örneği

Vaka Çalışması: Bir Üniversite Seviye Belirleme Sınavında PVST Kullanımı

Bir üniversite, 200 yeni gelen uluslararası öğrenciye PVST'yi uygulamaktadır. Test, kelime dağarcığı 15.000 kelimenin altında olan 30 öğrenciyi belirleyerek onlara bir hazırlık dil kursu önermektedir. Bir dönem sonra yapılan tekrar testi, ortalama 4.200 kelimelik bir artış göstererek testin öğretime duyarlılığını doğrulamaktadır. Uyarlanabilir algoritma, her öğrencinin seviyesine uygun maddeleri görmesini sağlayarak hayal kırıklığını ve test yorgunluğunu azaltmaktadır.

11. Gelecekteki Uygulamalar ve Yönelimler

PVST, yazma tabanlı bir hatırlama bileşeni eklenerek üretken kelime dağarcığını değerlendirecek şekilde genişletilebilir. Doğal dil işleme (NLP) modelleriyle entegrasyon, yazma görevlerinde kelime kullanımının gerçek zamanlı analizini mümkün kılabilir. Gelecekteki sürümler, çok modlu kelime bilgisini değerlendirmek için çoklu ortam uyaranlarını (ses, görüntü) içerebilir. Aynı IRT çerçevesi kullanılarak diğer Slav dilleri (ör. Çekçe, Ukraynaca) için diller arası uyarlamalar planlanmaktadır. Klinik nöropsikolojide PVST, yaşa bağlı kelime dağarcığı değişikliklerine duyarlılığı göz önüne alındığında, demansta dil gerilemesi için bir tarama aracı olarak hizmet edebilir.

12. Kaynakça

Bohn, M., ve ark. (2024). Çocuklar için uyarlanabilir kelime testleri. Language Learning, 74(1), 45-78.
Brysbaert, M., ve ark. (2016). Kaç kelime biliyoruz? Frontiers in Psychology, 7, 1116.
Coxhead, A., ve ark. (2014). Kelime Dağarcığı Büyüklüğü Testi: Eleştirel bir inceleme. Applied Linguistics, 35(2), 201-220.
Golovin, G. (2015). Rusça için uyarlanabilir çevrimiçi kelime dağarcığı büyüklüğü testi. Russian Language Studies, 12(3), 55-72.
Keuleers, E., ve ark. (2015). Felemenkçede kelime dağarcığı büyüklüğü. Behavior Research Methods, 47(4), 1001-1015.
Lemhöfer, K., & Broersma, M. (2012). LexTale'in tanıtımı. Behavior Research Methods, 44(2), 325-343.
Nation, I.S.P., & Beglar, D. (2007). Bir kelime dağarcığı büyüklüğü testi. JALT Journal, 29(1), 9-24.
Read, J. (2023). Kelime bilgisi derinliğini değerlendirme. Language Testing, 40(3), 567-589.
Weiss, D.J. (2011). Eğitimde uyarlanabilir testler. Educational Measurement, 30(4), 3-15.

13. Uzman Yorumu

Temel İçgörü: PVST sadece başka bir kelime testi değildir; statik, herkese uyan tek tip değerlendirmelerden dinamik, kişiselleştirilmiş ölçüme doğru bir paradigma değişimidir. IRT'den yararlanarak, çoktan seçmeli testleri etkileyen tahmin sorununu çözer ve sabit testlerin ancak hayal edebileceği bir hassasiyet sunar.

Mantıksal Akış: Yazarlar, VST ve LexTale'deki kusurları (puan şişkinliği, tekrarlanabilirlik eksikliği) doğru bir şekilde tespit etmekte ve mantıksal alternatif olarak CAT'yi önermektedir. Pilot veriler, PVST'nin daha hızlı, daha güvenilir ve yaş etkilerine karşı daha duyarlı olduğunu ikna edici bir şekilde göstermektedir. Sorun tanımlamadan çözüme ve doğrulamaya kadar olan ilerleme ders kitabı niteliğinde mükemmeldir.

Güçlü Yönler ve Kusurlar: En büyük güç, test süresini %40 oranında azaltırken güvenilirliği artıran uyarlanabilir algoritmadır. Yaş-kelime dağarcığı korelasyonu (R²=0.34) sağlamdır ve önceki çalışmalarla uyumludur. Bununla birlikte, test yalnızca tek bir biçim (kelime tanıma) aracılığıyla alıcı kelime dağarcığı derinliğini ölçmektedir. Bu, sözcüksel yeterliliğin dar bir dilimidir. Ayrıca, 1.200 kişilik örneklem iyi olmakla birlikte çok büyük değildir; testin klinik gruplar da dahil olmak üzere daha büyük ve daha çeşitli popülasyonlarda doğrulanması gerekmektedir.

Uygulanabilir Çıkarımlar: Araştırmacılar için: Kelime dağarcığı büyümesinin boylamsal çalışmaları için PVST'yi kullanın; hassasiyeti küçük etki boyutlarını tespit edecektir. Eğitimciler için: Seviye belirleme testleri için PVST'yi benimseyin; kağıt tabanlı testlerden daha hızlı ve daha doğrudur. Test geliştiricileri için: PVST'yi üretken ve bağlamsal ölçümleri içerecek şekilde genişletin ve otomatik madde oluşturma için NLP entegrasyonunu keşfedin. Gelecek uyarlanabilirdir; statik testlerle geride kalmayın.