1. 引言

ChatGPT嘅空前普及,標誌住個人為咗教育目的而與科技互動嘅範式轉移。本文研究以英語為外語嘅中學生,喺提示工程呢項新興技能上嘅表現。雖然好似ChatGPT呢類大型語言模型為寫作發展提供咗巨大潛力,但佢哋嘅效能取決於用戶能否設計出精準、有效嘅指令。本研究捕捉咗新手用戶實時、試錯嘅過程,分析佢哋為完成指定寫作任務而輸入嘅提示內容、質素同演變。研究結果揭示咗幾種唔同嘅行為路徑,強調咗喺EFL課程中加入結構化提示工程教育嘅迫切性,以幫助學生從低效嘅試驗,轉向與AI進行策略性協作。

2. 文獻綜述與背景

2.1 頂尖聊天機械人嘅興起

以ChatGPT為代表嘅頂尖生成式AI聊天機械人,相比起以往基於規則嘅系統,實現咗量子飛躍。佢哋由喺龐大語料庫上訓練嘅神經網絡語言模型驅動,能夠基於概率預測生成類人文本,實現更靈活、更具情境感知嘅互動(Caldarini等人,2022)。「ChatGPT」呢個詞越嚟越常用作呢類AI嘅統稱,設定咗新嘅效能標準。

2.2 提示工程作為關鍵技能

提示工程係設計輸入內容以引導大型語言模型產生期望輸出嘅藝術同科學。佢唔單止係一項技術技能,更係一種計算思維元語言意識。有效嘅提示通常需要清晰度、上下文、限制條件同埋例子(少樣本學習)。對於非技術用戶嚟講,呢個過程帶來咗顯著嘅學習曲線,通常以反覆猜測為特徵。

2.3 AI喺EFL教育中嘅應用

關於AI喺語言學習中嘅研究,一直集中喺自動寫作評估同智能輔導系統。頂尖聊天機械人嘅互動性、生成性引入咗一種新動態——將學習者嘅角色從反饋接收者轉變為認知工具嘅指揮者。呢個轉變需要新嘅素養,將傳統寫作技能同AI互動策略結合起嚟。

3. 研究方法

3.1 參與者與數據收集

本研究涉及香港嘅中學EFL學生,佢哋之前冇使用頂尖聊天機械人嘅經驗。參與者嘅任務係使用ChatGPT完成一項特定嘅寫作作業(例如,一篇議論文或描述性段落)。主要數據包括iPad屏幕錄影,記錄咗完整嘅提示序列、ChatGPT嘅回應,以及學生所作嘅任何修改。

3.2 分析框架

本研究採用咗質性案例研究方法。屏幕錄影被轉錄並根據兩個主要維度進行編碼:(1)提示內容(例如,任務規格、風格要求、修改指令)同(2)互動模式(例如,對話輪數、基於輸出嘅調整)。模式被聚類以識別唔同嘅用戶路徑。

4. 結果:四種提示工程路徑

對屏幕錄影嘅分析揭示咗四種原型路徑,代表咗策略方法同提示複雜度嘅唔同組合。

路徑分佈

基於觀察到嘅群體模式。

  • 極簡主義者: ~35%
  • 迭代優化者: ~30%
  • 結構規劃者: ~20%
  • 對話探索者: ~15%

4.1 極簡主義者

呢類用戶輸入非常簡短、通常係單句嘅提示,直接複述原始任務指令(例如,「寫一篇關於氣候變化嘅文章」)。佢哋對迭代嘅容忍度好低;如果初始輸出唔理想,佢哋好可能會放棄使用工具,或者提交次等嘅結果。呢條路徑反映咗一種將工具視為神諭嘅誤解。

4.2 迭代優化者

呢個群體從一個簡單提示開始,但會進行線性嘅優化過程。基於AI嘅輸出,佢哋會發出後續指令,例如「寫長啲」、「用簡單啲嘅詞語」或者「加多啲例子」。互動係反應式同漸進式嘅,顯示出對AI指令回應性嘅初步理解,但缺乏整體規劃。

4.3 結構規劃者

少數學生以預先構思好嘅結構去處理任務。佢哋嘅初始提示非常全面,指定咗格式、語氣、要點,有時仲會提供大綱(例如:「寫一篇5段式議論文,支持可再生能源。第1段:引言。第2段:經濟效益… 使用正式語氣。」)。呢條路徑能以更少嘅對話輪數產生更高質素嘅輸出,表明咗更高階嘅任務分解元認知規劃能力。

4.4 對話探索者

呢類用戶將ChatGPT視為對話夥伴。佢哋唔單止發出指令,仲會問元問題(「點樣可以改進我嘅論點陳述?」)或者請求解釋(「點解你揀呢個詞?」)。呢條路徑將寫作輔助同學習寫作結合埋一齊,雖然過程可能會漫無目的,未必能高效完成核心任務。

5. 討論與啟示

5.1 超越試錯法

極簡主義者同迭代優化者路徑嘅普遍性,凸顯咗一個關鍵缺口。如果任由學生自己摸索,大多數人並唔會自發發展出成熟嘅提示工程策略。佢哋嘅過程效率低下,而且往往未能充分利用AI嘅全部能力,甚至可能強化被動學習嘅習慣。

5.2 教學整合

本研究主張喺EFL寫作課堂中進行明確嘅提示工程教育。呢個應該包括:

  • 直接教學: 教授提示嘅組成部分(角色、任務、上下文、限制條件、例子)。
  • 結構化框架: 引入好似RTF(角色、任務、格式)或者CRISPE(能力、角色、洞察、陳述、個性、實驗)呢類模型。
  • 批判與分析: 評估AI生成嘅輸出,以理解提示同成品之間嘅因果關係。
  • 倫理考量: 討論作者身份、抄襲,以及對AI內容嘅批判性評估。

目標係培養學生成為AI生成文本嘅策略性指揮者,而唔係被動消費者

6. 技術分析與框架

核心洞察、邏輯流程、優點與不足、可行建議

核心洞察: 本文揭示咗一個關鍵但常被忽略嘅事實:好似ChatGPT呢類AI工具嘅普及,並唔會自動帶來能力嘅普及。介面看似簡單,但有效互動所需嘅認知負荷其實好高。「AI增強課堂」嘅真正瓶頸唔係技術嘅獲取,而係缺乏互動素養。本研究巧妙地將焦點從AI嘅輸出轉移到人類嘅輸入,揭示咗原始、未經修飾嘅學習曲線。

邏輯流程: 論證方法嚴謹且具說服力。首先確立問題(頂尖聊天機械人需要熟練嘅提示),引入知識缺口(新手實際上點樣做?),呈現細緻嘅實證證據(四種路徑),最後以有力嘅行動呼籲作結(教育必須適應)。案例研究嘅使用將理論紮根於複雜嘅現實中。

優點與不足: 主要優點係其生態效度。使用首次用戶喺真實任務情境中嘅屏幕錄影,提供咗實驗室研究往往缺乏嘅真實數據。四路徑分類法直觀,為教育工作者診斷學生行為提供咗強大框架。主要不足,作者亦已承認,係規模問題。呢個係一個深入嘅案例研究,唔係廣泛嘅調查。路徑係說明性嘅,唔具統計普遍性。此外,研究聚焦於過程,並冇嚴格測量唔同路徑下最終書面成品嘅質素——呢個係關鍵嘅下一步。

可行建議: 對於教育工作者同課程設計者嚟講,本文係一個警鐘。佢提供咗一個清晰嘅指令:提示工程係21世紀嘅核心素養,必須被教授,而非自然習得。 學校應該開發整合咗好似提示層級模型呢類框架嘅微課程,該模型從基本指令提示($P_{cmd}$)進階到複雜迭代推理提示($P_{reason}$)。例如,教導學生高質素提示嘅公式:$P_{optimal} = R + T + C + E$,其中$R$係角色,$T$係任務,$C$係限制條件,$E$係例子。教育科技公司應該將呢啲教學支架直接整合到佢哋嘅介面中,提供引導式提示構建模板同反饋,超越空白文本框。

技術細節與數學表述

從機器學習嘅角度睇,用戶嘅提示$p$作為語言模型$M$嘅條件上下文。模型基於概率分佈$P(o | p, \theta)$生成輸出序列$o$,其中$\theta$代表模型嘅參數。一個有效嘅提示會降低呢個輸出分佈嘅熵,引導佢趨向用戶嘅預期目標$t$。學生嘅挑戰在於最小化可能輸出嘅分佈同佢哋目標之間嘅差異,形式化為最小化$D_{KL}(P(o|p, \theta) \,||\, P(o|t))$,其中$D_{KL}$係Kullback–Leibler散度。新手用戶透過試錯,正在對$p$進行一種粗略嘅、人在迴路嘅優化以實現呢個目標。

分析框架示例案例

情境: 一名學生必須寫一封說服信畀校長,建議開展回收計劃。

極簡主義者路徑(無效):
提示 1: 「寫一封關於回收嘅信。」
輸出:一封通用、平淡嘅信。
學生行動: 對輸出作少量編輯後提交。

結構規劃者路徑(有效 - 使用RTF框架):
提示 1: 「扮演一名關心環境嘅中四學生。寫一封正式嘅說服信畀中學校長。目標係說服佢喺食堂同課室實施全面嘅塑膠同紙張回收計劃。使用尊重但急切嘅語氣。包含三個論點:1)環境影響,2)學生參與/領導機會,3)潛在嘅成本節省或資助機會。按照日期、稱呼、每個論點嘅正文段落同結尾簽名嘅格式寫信。」
輸出:一封結構良好、目標明確、具說服力嘅信。
學生行動: 審視輸出,可能會要求優化:「加一個統計數據,令第三個關於成本節省嘅論點更有力。」

呢個對比展示咗應用一個簡單嘅結構化框架(角色:學生,任務:寫信,格式:正式並包含特定論點)如何顯著提升AI協作嘅效率同質素。

實驗結果與圖表描述

本研究嘅關鍵結果係質性嘅,體現喺路徑描述中。一個假設嘅量化延伸可能會產生好似以下嘅圖表:「圖1:按路徑劃分嘅互動效率與輸出質素。」 X軸代表提示輪數(效率嘅倒數),Y軸代表最終文本嘅質素評分(例如,透過評分量表評估)。我哋預期:
- 極簡主義者 會聚集喺高效率(低輪數)但低質素嘅象限。
- 迭代優化者 會顯示中到高輪數,質素參差。
- 結構規劃者 會佔據高效率、高質素嘅象限(低輪數,高評分)。
- 對話探索者 會喺低效率(高輪數)象限,質素參差,如果探索有焦點,質素可能好高。呢個視覺化會有力論證結構規劃者路徑代表咗教學嘅最佳目標。

7. 未來應用與方向

呢項研究嘅啟示超越咗EFL課堂:

  • 自適應提示輔導系統: 開發AI驅動嘅輔導系統,分析學生嘅提示歷史,診斷佢哋嘅路徑,並提供實時、有支架嘅反饋,引導佢哋走向更有效嘅策略(例如,「試吓喺下一個提示中指定你嘅受眾」)。
  • 跨學科素養: 將提示工程整合到STEM教育中,用於代碼生成、數據分析查詢同科學解釋,正如MIT嘅RAISE倡議等機構所提倡嘅。
  • 勞動力準備: 正如世界經濟論壇報告所指,提示工程正迅速成為各行各業都重視嘅技能。中學教育必須為學生應對呢個現實做好準備。
  • 縱向研究: 追蹤提示工程技能隨教學嘅發展,以及佢哋同傳統寫作同批判性思維技能提升嘅相關性。
  • 多模態提示: 未來研究必須探索針對多模態AI(例如DALL-E、Sora)嘅提示工程,呢類指令涉及視覺、時間同風格限制——一個更複雜嘅素養前沿。

8. 參考文獻

  1. Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
  2. Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. [手稿準備中].
  3. Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.
  4. Moor, J. (2006). The Dartmouth College Artificial Intelligence Conference: The Next Fifty Years. AI Magazine, 27(4), 87–91.
  5. MIT RAISE. (2023). Day of AI Curriculum. Massachusetts Institute of Technology. 取自 [https://www.dayofai.org/]
  6. World Economic Forum. (2023). Future of Jobs Report 2023.
  7. Reynolds, L., & McDonell, K. (2021). Prompt Programming for Large Language Models: Beyond the Few-Shot Paradigm. Extended Abstracts of the 2021 CHI Conference on Human Factors in Computing Systems.