1. Giriş
ChatGPT gibi en son teknoloji (SOTA) üretken yapay zeka sohbet robotlarının ortaya çıkışı, dil öğrenimi ve yazma desteğinde bir paradigma değişimi yaratmıştır. Kural tabanlı öncüllerinin aksine, Transformer gibi sinir ağı mimarileri üzerine inşa edilen bu modeller, tutarlı ve bağlamsal olarak ilgili metinler üretebilir. Yabancı Dil Olarak İngilizce (EFL) öğrenenler için bu, güçlü ama karmaşık bir araç sunmaktadır. Bu çalışmada belirlenen temel zorluk komut mühendisliği—yapay zekadan istenen çıktıları elde etmek için etkili talimatlar oluşturma becerisidir. Bu beceri olmadan, kullanıcılar, özellikle teknik olmayan öğrenciler, hayal kırıklığı yaratan bir deneme-yanılma sürecine mahkum olur ve aracın pedagojik potansiyelini sınırlar.
Bu makale, bir yazma görevini tamamlamak için ilk kez ChatGPT kullanan ortaokul EFL öğrencilerinin yeni gelişmekte olan komut mühendisliği davranışlarını araştırmaktadır. Teorik tartışmanın ötesine geçerek, farklı kullanıcı yollarını ortaya koyan ampirik, nitel vaka çalışmaları sunmaktadır.
2. Metodoloji & Veri Toplama
Araştırma, acemi kullanıcılardan gerçek dünya etkileşim verilerini analiz eden nitel bir vaka çalışması yaklaşımı kullanmaktadır.
2.1. Katılımcılar & Görev
Katılımcılar, daha önce ChatGPT gibi SOTA sohbet robotlarını kullanma konusunda resmi deneyimi olmayan ortaokul EFL öğrencileriydi. Çalışma, yapay zeka ile tanımlanmış bir yazma görevini tamamlarken etkileşimlerini iPad ekran kayıtları aracılığıyla yakaladı. Bu metodoloji, insan-yapay zeka işbirliği sürecinin ham, filtrelenmemiş bir görünümünü sağlar.
2.2. Veri Analizi Çerçevesi
Ekran kayıtları, aşağıdakiler için kodlanmak üzere transkript edildi ve analiz edildi:
- Komut İçeriği: Her öğrenci sorgusunun dilbilimsel ve öğretimsel bileşenleri (örn., görev açıklaması, stil istekleri, kısıtlamalar).
- Komut Miktarı: Görevi tamamlamak için kullanılan komut sayısı.
- Etkileşim Modeli: Yapay zeka yanıtlarına dayalı takip komutlarının sırası ve doğası.
- Sonuç Kalitesi: Atanan görev için nihai yapay zeka tarafından üretilen metnin uygunluğu.
Bu analizden, dört arketipik kullanıcı yolu belirlendi ve detaylı vaka çalışmalarına dönüştürüldü.
3. Vaka Çalışmaları: Dört Komut Mühendisliği Yolu
Analiz, komut mühendisliği karmaşıklığının bir yelpazesini temsil eden dört farklı davranış modelini netleştirdi.
3.1. Yol A: Minimalist
Bu öğrenci çok az sayıda komut kullandı (örn., 1-2). İlk komut genellikle görev talimatının basit, doğrudan bir çevirisiydi (örn., "İklim değişikliği hakkında bir makale yaz"). Yapay zekanın çıktısıyla minimum düzeyde etkileşim gösterdiler, ilk sonucu neredeyse hiç iyileştirme yapmadan kabul ettiler. Bu yol, yapay zekanın işbirlikçi bir ortak yerine eksiksiz, nihai bir cevap sağladığı görülen araç-kahin yanılgısını vurgulamaktadır.
3.2. Yol B: Yinelemeli İyileştirici
Bu öğrenci, doğrusal, yinelemeli bir sırada orta düzeyde sayıda komut kullandı. Temel bir komutla başladılar, çıktıyı incelediler ve belirli iyileştirmeler için takip komutları verdiler (örn., "Daha uzun yap", "Daha basit kelimeler kullan"). Bu yol, yapay zekanın talimata duyarlılığına dair gelişmekte olan bir anlayışı gösterir ancak temel bir revizyon-istek çerçevesi içinde kalır.
3.3. Yol C: Yapılandırılmış Sorgulayıcı
Bu öğrenci, stratejik, çok aşamalı bir yaklaşımla daha fazla sayıda komut kullandı. İlk olarak yapay zekadan "X konusunda bir makale için üç fikir beyin fırtınası yap" isteyebilir, sonra birini seçer, ardından bir taslak ister ve son olarak o taslağa dayalı bir taslak metin talep edebilir. Bu yol, yazma sürecini parçalara ayıran ve her aşamada yapılandırılmış destek için yapay zekayı kullanan daha sofistike bir üst-bilişsel stratejiyi yansıtır.
3.4. Yol D: Deneme-Yanılma Kaşifi
Bu öğrenci, belirgin bir strateji olmaksızın önemli varyasyonla çok sayıda komut kullandı. Komutların odağı ve stili net bir ilerleme olmadan dramatik bir şekilde değişti (örn., resmiden günlük konuşmaya, genişten dara). Bu yol, acemi deneyimini karakterize eden, sıklıkla kafa karışıklığına ve zamanın verimsiz kullanımına yol açan, ancak ara sıra yaratıcı sonuçlar verebilen yapılandırılmamış deneyimi somutlaştırır.
4. Temel Bulgular & Analiz
4.1. Komut Kalitesi & Miktar Modelleri
Çalışma, komut sayısı ile nihai çıktının kalitesi arasında basit bir korelasyon bulamadı. Yol C (Yapılandırılmış Sorgulayıcı), en çok komutu kullanarak değil, en stratejik ve yüksek kaliteli komutları kullanarak genellikle göreve en uygun metni üretti. Kalite, özgüllük, bağlam sağlama ve görevin parçalara ayrılması ile tanımlandı. Tek bir iyi mühendislik ürünü komut (örn., "Okul dergisi için, kampüste daha fazla geri dönüşüm kutusu olmasını savunan, iki istatistik ve bir harekete geçirici mesaj kullanan 300 kelimelik ikna edici bir makale yaz"), bir düzine belirsiz komuttan daha iyi performans gösterebilir.
Etkileşim Özeti
Yol C (Yapılandırılmış), bağımsız değerlendiriciler tarafından her zaman en yüksek puan alan nihai taslakları verdi, her zaman en fazla turu kullanmasa bile. Yol D (Deneme-Yanılma) ise sonuç kalitesinde en yüksek varyansa sahipti.
4.2. Yapay Zeka Okuryazarlığının Rolü
Yollar, örtük yapay zeka okuryazarlığının değişen seviyelerini açıkça göstermektedir. A ve D Yollarındaki öğrenciler, ChatGPT'nin istekleri nasıl işlediğine dair işlevsel bir zihinsel modele sahip değildi. Buna karşılık, B ve C Yollarındaki öğrenciler, yapay zekayı stokastik, talimat takip eden bir sistem olarak anlamaya başladıklarını gösterdi. Daha net, daha yapılandırılmış girdilerin daha öngörülebilir ve kullanışlı çıktılara yol açtığını sezgisel olarak kavradılar. Bu bulgu, Uluslararası Eğitim Teknolojileri Topluluğu (ISTE) gibi kuruluşların yapay zeka okuryazarlığı temellerini K-12 müfredatına entegre etme çağrılarını doğrudan desteklemektedir.
5. Teknik Çerçeve & Analiz
Bu yolları anlamak teknik bir bakış açısı gerektirir. ChatGPT ve benzeri modeller Transformer mimarisine dayanır ve temelde bir sonraki token tahmincisidir. Bir girdi komutu $P$ verildiğinde belirli bir çıktı dizisi $O$ üretme olasılığı şu şekilde modellenir:
$$P(O|P) = \prod_{t=1}^{|O|} P(o_t | P, o_1, ..., o_{t-1})$$
burada $o_t$, $t$ konumundaki tokendır. Bir öğrencinin komutu $P$, çıktı için başlangıç bağlamını ve olasılık dağılımını belirler.
Analiz Çerçevesi Örneği: Bir öğrencinin komut mühendisliği oturumunu bir durum makinesi olarak modelleyebiliriz. Durum (S), konuşmanın mevcut bağlam penceresi (son $k$ token) olsun. Eylem (A), öğrencinin bir sonraki komutu olsun. Ödül (R), yapay zekanın yanıtının algılanan kullanışlılığı olsun (örn., 1-5 arası öznel bir puan). Öğrencinin amacı, kümülatif ödülü maksimize etmek için durumları eylemlere eşleyen bir politika $\pi$ öğrenmektir. Dört yol, insan kullanıcının karşılaştığı bu pekiştirmeli öğrenme problemi için farklı, genellikle optimal olmayan keşif politikalarını temsil eder.
Grafik Açıklaması: Kavramsal bir grafik, Komut Özgüllüğünü (X-ekseni) Görev Ayrıştırmasına (Y-ekseni) karşı çizer. Yol A (Minimalist) düşük-düşük çeyrekte kümelenir. Yol D (Deneme-Yanılma) grafik üzerinde dağınık bir bulut gösterir. Yol B (Yinelemeli İyileştirici) yatay olarak sağa doğru bir hareket gösterir (özgüllüğü artırır). Yol C (Yapılandırılmış Sorgulayıcı) yüksek-yüksek çeyreği işgal eder, komutlarında hem yüksek özgüllüğü hem de yüksek görev ayrıştırma kullanımını gösterir.
6. Eğitimsel Çıkarımlar & Gelecek Yönelimler
Temel Çıkarım: Öğrencilerin komut mühendisliğini deneme-yanılma yoluyla keşfetmelerine izin vermek pedagojik olarak verimsiz ve eşitsizdir. Doğal olarak stratejik düşünce geliştiren öğrencileri (Yol C) kayırır ve diğerlerini dezavantajlı duruma düşürür.
Uygulanabilir Strateji: Açık, destekli komut mühendisliği eğitimi EFL yazma pedagojisine entegre edilmelidir. Bu şunları içerir:
- "Rol-Hedef-Biçim-Kısıtlamalar" komut çerçevesinin öğretilmesi.
- Yinelemeli iyileştirmenin gösterilmesi (örn., ChatGPT'nin "yeniden oluştur" veya "devam et" işlevlerinin stratejik kullanımı).
- Yapay zeka çıktılarının önyargı, doğruluk ve stil açısından eleştirel değerlendirilmesi.
Gelecek Araştırma & Geliştirme:
- Uyarlanabilir Öğrenme Arayüzleri: Gelecekteki yapay zeka yazma asistanları, bir kullanıcının yolunu tespit edebilir (örn., minimalist komutları algılayarak) ve onları daha etkili stratejilere yönlendirmek için bağlamsal ipuçları veya öğreticiler sunabilir.
- Komut Kütüphaneleri & Şablonları: Yaygın EFL yazma görevleri için küratörlü, seviyeye uygun komut şablonları geliştirilmesi (örn., "Karşılaştırma ve karşıtlık makalesi oluşturucu").
- Boylamsal Çalışmalar: Öğrencilerin komut mühendisliği yollarının eğitim ve deneyimle zaman içinde nasıl evrildiğinin takip edilmesi.
- Diller Arası & Kültürel Çalışmalar: Komut mühendisliği stratejilerinin diller ve eğitim kültürleri arasında önemli ölçüde farklılık gösterip göstermediğinin araştırılması.
7. Kaynakça
- Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. Hazırlanmakta olan el yazması.
- Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
- Long, D., & Magerko, B. (2020). What is AI Literacy? Competencies and Design Considerations. Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems, 1–16.
- Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30 (NIPS 2017).
- International Society for Technology in Education (ISTE). (2023). AI Explorations for Educators. Erişim adresi: iste.org.
- Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.
8. Analist Perspektifi: İnsan-Yapay Zeka Yazma Dansının Yapısökümü
Temel İçgörü: Bu çalışma aslında ChatGPT ile ilgili değil; insan-yapay zeka geri bildirim döngüsündeki hazırlıksız insanın çarpıcı bir açığa çıkarılışıdır. Araç, kullanıcının onu yönlendirme yeteneğinden katlanarak daha yeteneklidir. Dört yol sadece davranışlar değil; yeni bir dijital okuryazarlık biçimi için tanısal belirteçlerdir. Gerçek ürün açığı daha iyi bir LLM değil, etkileşim stratejisini gerçek zamanlı olarak öğreten daha iyi bir insan arayüz katmanıdır.
Mantıksal Akış: Makale, sorunu doğru bir şekilde tanımlıyor (deneme-yanılma varsayılan) ve yol taksonomisi aracılığıyla zarif, ampirik kanıtlar sunuyor. Yaptığı mantıksal sıçrama—ve bu çok önemli—bu acemi davranışların geçici bir aşama olmadığıdır. Müdahale olmadan, Minimalist ve Deneme-Yanılma Kaşifi yolları, kullanıcının aracın varsayılanları tarafından yönlendirildiği, onu yönlendirmek yerine, kalıcı, optimal olmayan kullanım modellerine dönüşebilir. Bu, HCI araştırmalarındaki "otomasyon önyargısı" ve yüksek destekli sistemlerdeki "beceri kaybı" gibi daha geniş endişelerle uyumludur.
Güçlü & Zayıf Yönler: Güçlü yanı, temelli, gözlemsel metodolojisidir. Ekran kayıtları yalan söylemez. Örtük olarak kabul edilen büyük kusur ölçektir. Sınırlı bir örneklemden dört yol, ikna edici arketipler olup kesin kategoriler değildir. Çalışma ayrıca odadaki fili görmezden geliyor: değerlendirme. Eğer bir Minimalist, yapay zeka tarafından üretilmiş bir makaleyi kullanan çok çalışan bir öğretmenden geçer not alırsa, komut mühendisliğini öğrenmek için ne gibi bir teşviki olur? Makalenin eğitim önerileri, süreci üründen daha çok değer veren bir sisteme bağlıdır ki çoğu mevcut eğitim değerlendirme çerçevesi bunu yapmaz.
Uygulanabilir İçgörüler: EdTech yatırımcıları ve geliştiricileri için çıkarım açıktır: bir sonraki değer yaratma dalgası komut mühendisliği iskelesindedir. Komutlar için Grammarly gibi düşünün—bir öğrencinin ilk belirsiz komutunu analiz eden ve "Hedef kitle ve kelime sayısı eklemeyi deneyin. Bir örnek görmek için buraya tıklayın." önerisinde bulunan bir katman. Okul yöneticileri için görev, sadece yapay zekayı kullanma üzerine değil, yapay zekayla etkileşim pedagojisini öğretme üzerine mesleki gelişimi finanse etmektir. Bu çalışma, bu bütçe kalemi için argüman sunmak için mükemmel kanıtı sağlar. Son olarak, araştırmacılar için yol çerçevesi tekrarlanabilir bir lenstir. Bunu yapay zekayı kodlama (GitHub Copilot), tasarım veya hukuki araştırma için kullanan profesyonellere uygulayın. Aynı dört arketipi bulacağınızı tahmin ediyorum, bu da bunun sadece bir EFL sorunu değil, temel bir insan-bilgisayar etkileşimi zorluğu olduğunu kanıtlayacaktır.