1. Pengenalan

Kepopularan ChatGPT yang belum pernah berlaku sebelum ini menandakan anjakan paradigma dalam cara individu berinteraksi dengan teknologi untuk tujuan pendidikan. Kertas kerja ini menyiasat kemahiran baru kejuruteraan prompt dalam kalangan pelajar sekolah menengah Bahasa Inggeris sebagai Bahasa Asing (EFL). Walaupun Model Bahasa Besar (LLM) seperti ChatGPT menawarkan potensi besar untuk menyokong perkembangan penulisan, keberkesanannya bergantung pada keupayaan pengguna untuk mencipta arahan yang tepat dan berkesan. Kajian ini menangkap proses percubaan-dan-kesilapan masa nyata pengguna baharu, menganalisis kandungan, kualiti, dan evolusi prompt mereka untuk menyelesaikan tugasan penulisan yang ditetapkan. Penemuan mendedahkan laluan tingkah laku yang berbeza, menekankan keperluan mendesak untuk pendidikan kejuruteraan prompt berstruktur dalam kurikulum EFL untuk mengalihkan pelajar daripada eksperimen tidak cekap kepada kerjasama strategik dengan AI.

2. Sorotan Literatur & Latar Belakang

2.1 Kebangkitan Bot Sembang SOTA

Bot sembang AI generatif terkini (SOTA), yang diwakili oleh ChatGPT, melambangkan lompatan kuantum daripada pendahulu berasaskan peraturan. Dikuasakan oleh model bahasa rangkaian neural yang dilatih pada korpus yang luas, mereka menjana teks seperti manusia berdasarkan ramalan kebarangkalian, membolehkan interaksi yang lebih fleksibel dan sedar konteks (Caldarini et al., 2022). "ChatGPT" semakin digunakan sebagai istilah generik untuk kelas AI ini, menetapkan piawaian prestasi baharu.

2.2 Kejuruteraan Prompt sebagai Kemahiran Kritikal

Kejuruteraan prompt adalah seni dan sains mereka bentuk input untuk membimbing LLM ke arah output yang diingini. Ia bukan sekadar kemahiran teknikal tetapi satu bentuk pemikiran pengiraan dan kesedaran meta-linguistik. Prompt yang berkesan selalunya memerlukan kejelasan, konteks, kekangan, dan contoh (pembelajaran sedikit contoh). Bagi pengguna bukan teknikal, ini mewakili lengkung pembelajaran yang ketara, selalunya dicirikan oleh tekaan berulang.

2.3 AI dalam Pendidikan EFL

Penyelidikan mengenai AI dalam pembelajaran bahasa memberi tumpuan kepada penilaian penulisan automatik (AWE) dan sistem tutor pintar. Sifat interaktif dan generatif bot sembang SOTA memperkenalkan dinamik baharu—mengalihkan peranan pelajar daripada penerima maklum balas kepada pengarah alat kognitif. Ini memerlukan literasi baharu, menggabungkan kemahiran penulisan tradisional dengan strategi interaksi AI.

3. Metodologi

3.1 Peserta & Pengumpulan Data

Kajian ini melibatkan pelajar sekolah menengah EFL di Hong Kong tanpa pengalaman sebelumnya menggunakan bot sembang SOTA. Peserta diberikan tugas untuk menyelesaikan tugasan penulisan tertentu (contohnya, esei argumentatif atau perenggan deskriptif) menggunakan ChatGPT. Data utama terdiri daripada rakaman skrin iPad, menangkap urutan lengkap prompt, respons ChatGPT, dan sebarang semakan yang dibuat oleh pelajar.

3.2 Kerangka Analisis

Pendekatan kajian kes kualitatif digunakan. Rakaman skrin ditranskripsi dan dikodkan sepanjang dua dimensi utama: (1) Kandungan Prompt (contohnya, spesifikasi tugas, permintaan gaya, arahan semakan) dan (2) Corak Interaksi (contohnya, bilangan pusingan, penyesuaian berdasarkan output). Corak dikelompokkan untuk mengenal pasti laluan pengguna yang berbeza.

4. Keputusan: Empat Laluan Kejuruteraan Prompt

Analisis rakaman skrin mendedahkan empat laluan prototaip, mewakili gabungan berbeza pendekatan strategik dan kecanggihan prompt.

Taburan Laluan

Berdasarkan corak yang diperhatikan dalam kohort.

  • The Minimalist (Peminimal): ~35%
  • The Iterative Refiner (Penyempurna Berulang): ~30%
  • The Structured Planner (Perancang Berstruktur): ~20%
  • The Conversational Explorer (Peneroka Perbualan): ~15%

4.1 The Minimalist (Peminimal)

Pengguna ini memasukkan prompt yang sangat ringkas, selalunya ayat tunggal yang mencerminkan arahan tugas asal (contohnya, "Tulis esei tentang perubahan iklim"). Mereka menunjukkan toleransi yang rendah untuk lelaran; jika output awal tidak memuaskan, mereka cenderung untuk meninggalkan alat tersebut atau menyerahkan hasil yang kurang baik. Laluan ini mencerminkan salah tanggapan alat-sebagai-orakel.

4.2 The Iterative Refiner (Penyempurna Berulang)

Kumpulan ini bermula dengan prompt mudah tetapi terlibat dalam proses penyempurnaan linear. Berdasarkan output AI, mereka mengeluarkan arahan susulan seperti "buat lebih panjang," "gunakan perkataan yang lebih mudah," atau "tambah lebih banyak contoh." Interaksi adalah reaktif dan beransur-ansur, menunjukkan pemahaman yang muncul tentang responsif AI terhadap arahan tetapi kekurangan perancangan menyeluruh.

4.3 The Structured Planner (Perancang Berstruktur)

Minoriti pelajar mendekati tugas dengan struktur yang dirancang terlebih dahulu. Prompt awal mereka adalah komprehensif, menentukan format, nada, titik utama, dan kadangkala menyediakan rangka (contohnya, "Tulis esei 5 perenggan yang memperjuangkan tenaga boleh diperbaharui. Perenggan 1: Pengenalan. Perenggan 2: Faedah ekonomi... Gunakan nada formal."). Laluan ini menghasilkan output berkualiti lebih tinggi dengan pusingan yang lebih sedikit, menunjukkan penguraian tugas dan perancangan meta-kognitif yang maju.

4.4 The Conversational Explorer (Peneroka Perbualan)

Pengguna ini memperlakukan ChatGPT sebagai rakan dialog. Daripada hanya mengeluarkan arahan, mereka bertanya soalan meta ("Bagaimana saya boleh memperbaiki pernyataan tesis saya?") atau meminta penjelasan ("Mengapa anda memilih perkataan ini?"). Laluan ini menggabungkan bantuan penulisan dengan pembelajaran tentang penulisan, walaupun ia boleh merayau dan mungkin tidak menyelesaikan tugas teras dengan cekap.

5. Perbincangan & Implikasi

5.1 Melangkah Melalui Percubaan-dan-Kesilapan

Kebiasaan laluan Peminimal dan Penyempurna Berulang menonjolkan jurang kritikal. Dibiarkan sendiri, kebanyakan pelajar tidak secara spontan membangunkan strategi kejuruteraan prompt yang canggih. Proses mereka tidak cekap dan selalunya gagal memanfaatkan keupayaan penuh AI, berpotensi mengukuhkan tabiat pembelajaran pasif.

5.2 Integrasi Pedagogi

Kajian ini memperjuangkan pendidikan kejuruteraan prompt yang eksplisit dalam bilik darjah penulisan EFL. Ini harus merangkumi:

  • Pengajaran Langsung: Mengajar komponen prompt (peranan, tugas, konteks, kekangan, contoh).
  • Kerangka Berstruktur: Memperkenalkan model seperti RTF (Role, Task, Format) atau CRISPE (Capacity, Role, Insight, Statement, Personality, Experiment).
  • Kritikan dan Analisis: Menilai output yang dijana AI untuk memahami hubungan sebab-akibat antara prompt dan produk.
  • Pertimbangan Etika: Membincangkan pengarang, plagiarisme, dan penilaian kritikal terhadap kandungan AI.

Matlamatnya adalah untuk memupuk pelajar yang menjadi pengarah strategik dan bukannya pengguna pasif teks yang dijana AI.

6. Analisis Teknikal & Kerangka

Inti Pati Teras, Aliran Logik, Kekuatan & Kelemahan, Panduan Tindakan

Inti Pati Teras: Kertas kerja ini menyampaikan kebenaran penting yang sering terlepas: demokratisasi alat AI seperti ChatGPT tidak secara automatik mendemokrasikan kompetensi. Antara muka kelihatan mudah secara mengelirukan, tetapi beban kognitif interaksi berkesan adalah tinggi. Halangan sebenar dalam "bilik darjah dipertingkatkan AI" bukanlah akses kepada teknologi; ia adalah kekurangan literasi interaksi. Kajian ini dengan cemerlang mengalihkan fokus daripada output AI kepada input manusia, mendedahkan lengkung pembelajaran mentah dan tanpa hiasan.

Aliran Logik: Hujahnya adalah metodikal dan meyakinkan. Ia bermula dengan menetapkan masalah (bot sembang SOTA memerlukan prompt yang mahir), memperkenalkan jurang pengetahuan (bagaimana pemula sebenarnya melakukan ini?), membentangkan bukti empirikal terperinci (empat laluan), dan menyimpulkan dengan seruan bertindak yang kuat (pendidikan mesti menyesuaikan diri). Penggunaan kajian kes membumikan teori dalam realiti yang tidak kemas.

Kekuatan & Kelemahan: Kekuatan utamanya ialah kesahan ekologi. Menggunakan rakaman skrin pengguna kali pertama dalam konteks tugas sebenar menyediakan data autentik yang sering kekurangan dalam kajian makmal. Tipologi empat laluan adalah intuitif dan menyediakan kerangka yang berkuasa untuk pendidik mendiagnosis tingkah laku pelajar. Kelemahan utama, yang diakui oleh penulis, adalah skala. Ini adalah kajian kes mendalam, bukan tinjauan luas. Laluan-laluan adalah ilustratif, bukan boleh digeneralisasikan secara statistik. Tambahan pula, kajian memberi tumpuan kepada proses, bukan mengukur secara ketat kualiti produk penulisan akhir merentas laluan—langkah seterusnya yang kritikal.

Panduan Tindakan: Bagi pendidik dan pereka kurikulum, kertas kerja ini adalah panggilan bangun. Ia memberikan mandat yang jelas: Kejuruteraan prompt adalah literasi teras abad ke-21 dan mesti diajar, bukan ditangkap. Sekolah harus membangunkan mikro-pelajaran yang mengintegrasikan kerangka seperti Model Hierarki Prompt, yang bergerak daripada prompt arahan asas ($P_{cmd}$) kepada prompt penaakulan lelaran kompleks ($P_{reason}$). Sebagai contoh, mengajar pelajar formula untuk prompt berkualiti tinggi: $P_{optimal} = R + T + C + E$, di mana $R$ ialah Peranan, $T$ ialah Tugas, $C$ ialah Kekangan, dan $E$ ialah Contoh. Syarikat EdTech harus membina perancah pedagogi ini terus ke dalam antara muka mereka, menawarkan templat pembinaan prompt berpandu dan maklum balas, melangkaui kotak teks kosong.

Butiran Teknikal & Formulasi Matematik

Dari perspektif pembelajaran mesin, prompt pengguna $p$ berfungsi sebagai konteks pengkondisian untuk model bahasa $M$. Model menjana urutan output $o$ berdasarkan taburan kebarangkalian $P(o | p, \theta)$, di mana $\theta$ mewakili parameter model. Prompt yang berkesan mengurangkan entropi taburan output ini, mengarahkannya ke arah sasaran yang dimaksudkan pengguna $t$. Cabaran pelajar adalah untuk meminimumkan perbezaan antara taburan output yang mungkin dan matlamat mereka, diformalkan sebagai meminimumkan $D_{KL}(P(o|p, \theta) \,||\, P(o|t))$, di mana $D_{KL}$ ialah perbezaan Kullback–Leibler. Pengguna baharu, melalui percubaan-dan-kesilapan, melakukan pengoptimuman kasar, manusia-dalam-gelung bagi $p$ untuk mencapai ini.

Contoh Kes Kerangka Analisis

Senario: Seorang pelajar mesti menulis surat persuasif kepada pengetua sekolah tentang memulakan program kitar semula.

Laluan Peminimal (Tidak Berkesan):
Prompt 1: "Tulis surat tentang kitar semula."
Output: Surat generik dan hambar.
Tindakan Pelajar: Menyerahkan output dengan suntingan kecil.

Laluan Perancang Berstruktur (Berkesan - Menggunakan Kerangka RTF):
Prompt 1: "Bertindak sebagai pelajar Tingkatan 4 yang prihatin. Tulis surat persuasif formal kepada pengetua sekolah menengah. Matlamatnya adalah untuk meyakinkan mereka melaksanakan program kitar semula plastik dan kertas yang komprehensif di kafeteria dan bilik darjah. Gunakan nada hormat tetapi mendesak. Sertakan tiga hujah: 1) Kesan alam sekitar, 2) Peluang penglibatan/kepimpinan pelajar, 3) Potensi penjimatan kos atau geran. Format surat dengan tarikh, salam, perenggan badan untuk setiap hujah, dan tandatangan penutup."
Output: Surat yang berstruktur baik, disasarkan, dan persuasif.
Tindakan Pelajar: Menyemak output, mungkin meminta penyempurnaan: "Perkuatkan hujah ketiga tentang penjimatan kos dengan menambah statistik."

Kontras ini menunjukkan bagaimana menggunakan kerangka berstruktur mudah (Peranan: pelajar, Tugas: tulis surat, Format: formal dengan hujah khusus) meningkatkan kecekapan dan kualiti kerjasama AI secara dramatik.

Keputusan Eksperimen & Penerangan Carta

Keputusan utama kajian adalah kualitatif, ditangkap dalam penerangan laluan. Sambungan kuantitatif hipotesis boleh menghasilkan carta seperti: "Rajah 1: Kecekapan Interaksi vs. Kualiti Output mengikut Laluan." Paksi-x akan mewakili bilangan pusingan prompt (songsangan kecekapan), dan paksi-y akan mewakili skor kualiti teks akhir (contohnya, dinilai melalui rubrik). Kami menjangkakan:
- The Minimalist (Peminimal) berkelompok dalam kuadran kecekapan tinggi (pusingan rendah) tetapi kualiti rendah.
- The Iterative Refiner (Penyempurna Berulang) menunjukkan pusingan sederhana-ke-tinggi dengan kualiti berubah-ubah.
- The Structured Planner (Perancang Berstruktur) menduduki kuadran kecekapan tinggi, kualiti tinggi (pusingan rendah, skor tinggi).
- The Conversational Explorer (Peneroka Perbualan) berada dalam kuadran kecekapan rendah (pusingan tinggi) dengan kualiti berubah-ubah, berpotensi tinggi jika penerokaan difokuskan. Visualisasi ini akan berhujah dengan kuat bahawa laluan Perancang Berstruktur mewakili sasaran optimum untuk pengajaran.

7. Aplikasi & Hala Tuju Masa Depan

Implikasi penyelidikan ini melangkaui bilik darjah EFL:

  • Tutor Prompting Adaptif: Pembangunan tutor berkuasa AI yang menganalisis sejarah prompt pelajar, mendiagnosis laluan mereka, dan menawarkan maklum balas berperancah masa nyata untuk membimbing mereka ke arah strategi yang lebih berkesan (contohnya, "Cuba nyatakan audiens anda dalam prompt seterusnya").
  • Literasi Rentas Disiplin: Mengintegrasikan kejuruteraan prompt ke dalam pendidikan STEM untuk penjanaan kod, pertanyaan analisis data, dan penjelasan saintifik, seperti yang diperjuangkan oleh institusi seperti inisiatif RAISE MIT.
  • Persediaan Tenaga Kerja: Seperti yang dinyatakan dalam laporan Forum Ekonomi Dunia, kejuruteraan prompt dengan pantas menjadi kemahiran berharga merentas profesion. Pendidikan menengah mesti menyediakan pelajar untuk realiti ini.
  • Kajian Longitudinal: Menjejaki bagaimana kemahiran kejuruteraan prompt berkembang dari masa ke masa dengan pengajaran, dan bagaimana ia berkorelasi dengan peningkatan dalam kemahiran penulisan tradisional dan pemikiran kritikal.
  • Prompting Multimodal: Penyelidikan masa depan mesti meneroka kejuruteraan prompt untuk AI multimodal (contohnya, DALL-E, Sora), di mana arahan melibatkan kekangan visual, temporal, dan stilistik—sempadan literasi yang lebih kompleks.

8. Rujukan

  1. Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
  2. Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. [Manuscript in preparation].
  3. Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.
  4. Moor, J. (2006). The Dartmouth College Artificial Intelligence Conference: The Next Fifty Years. AI Magazine, 27(4), 87–91.
  5. MIT RAISE. (2023). Day of AI Curriculum. Massachusetts Institute of Technology. Retrieved from [https://www.dayofai.org/]
  6. World Economic Forum. (2023). Future of Jobs Report 2023.
  7. Reynolds, L., & McDonell, K. (2021). Prompt Programming for Large Language Models: Beyond the Few-Shot Paradigm. Extended Abstracts of the 2021 CHI Conference on Human Factors in Computing Systems.