1. 緒論

ChatGPT的空前普及,標誌著個人為教育目的與科技互動方式的典範轉移。本文探討以英語為外語的中學生,其提示工程這項新興技能的發展。儘管如ChatGPT這類大型語言模型在支援寫作發展上具有巨大潛力,但其效能取決於使用者能否設計出精確、有效的指令。本研究捕捉了新手使用者的即時試誤過程,分析他們為完成特定寫作任務所下達的提示內容、品質與演變。研究結果揭示了不同的行為路徑,強調了在EFL課程中引入結構化提示工程教育的迫切性,以引導學生從低效率的實驗,轉向與AI的策略性協作。

2. 文獻回顧與背景

2.1 頂尖聊天機器人的興起

以ChatGPT為代表的頂尖生成式AI聊天機器人,相較於基於規則的前輩,實現了量子飛躍。它們由在龐大語料庫上訓練的神經網路語言模型驅動,能基於機率預測生成類人文本,實現更靈活且具情境感知的互動(Caldarini等人,2022)。「ChatGPT」一詞正逐漸成為此類AI的通用術語,樹立了新的效能標準。

2.2 提示工程作為關鍵技能

提示工程是設計輸入以引導大型語言模型產生期望輸出的藝術與科學。它不僅是一項技術技能,更是一種計算思維後設語言意識。有效的提示通常需要清晰度、情境、限制條件和範例(少樣本學習)。對非技術使用者而言,這帶來了顯著的學習曲線,其特徵往往是反覆的猜測。

2.3 AI在EFL教育中的應用

關於AI在語言學習中的研究,以往多聚焦於自動寫作評分系統和智慧輔導系統。頂尖聊天機器人的互動性、生成性本質引入了一種新的動態——將學習者的角色從回饋接收者轉變為認知工具的指揮者。這需要融合傳統寫作技能與AI互動策略的新素養。

3. 研究方法

3.1 參與者與資料收集

本研究涉及香港的中學EFL學生,他們先前沒有使用頂尖聊天機器人的經驗。參與者的任務是使用ChatGPT完成一項特定的寫作作業(例如,一篇議論文或描述性段落)。主要資料為iPad螢幕錄影,完整記錄了提示序列、ChatGPT的回應以及學生所做的任何修改。

3.2 分析框架

本研究採用質性個案研究法。螢幕錄影被轉錄並沿兩個主要維度進行編碼:(1) 提示內容(例如,任務規格、風格要求、修改指令)和 (2) 互動模式(例如,對話輪次數量、基於輸出的調整)。將模式進行聚類,以識別不同的使用者路徑。

4. 結果:四種提示工程路徑

對螢幕錄影的分析揭示了四種原型路徑,代表了策略方法與提示複雜度的不同組合。

路徑分佈

基於觀察到的群體模式。

  • 極簡主義者: ~35%
  • 迭代精煉者: ~30%
  • 結構化規劃者: ~20%
  • 對話探索者: ~15%

4.1 極簡主義者

這些使用者輸入非常簡短、通常是單句的提示,直接反映原始任務指令(例如,「寫一篇關於氣候變遷的文章」)。他們對迭代的容忍度低;如果初始輸出不盡人意,他們很可能放棄使用該工具或提交品質不佳的結果。此路徑反映了工具即神諭的誤解。

4.2 迭代精煉者

這組使用者從簡單的提示開始,但會進行線性的精煉過程。根據AI的輸出,他們會發出後續指令,如「寫長一點」、「用更簡單的詞」或「增加更多例子」。互動是反應式和漸進式的,顯示出對AI指令回應性的初步理解,但缺乏整體規劃。

4.3 結構化規劃者

少數學生以預先構思的結構來處理任務。他們的初始提示非常全面,指定了格式、語氣、關鍵點,有時甚至提供大綱(例如,「寫一篇五段式議論文,支持再生能源。第一段:引言。第二段:經濟效益…使用正式語氣。」)。此路徑能以較少的對話輪次產出更高品質的輸出,顯示出高階的任務分解後設認知規劃能力。

4.4 對話探索者

這些使用者將ChatGPT視為對話夥伴。他們不僅僅下達指令,還會提出後設問題(「我該如何改進我的論點陳述?」)或請求解釋(「你為什麼選擇這個詞?」)。此路徑融合了寫作協助與寫作學習,儘管過程可能漫無目的,且未必能有效率地完成核心任務。

5. 討論與啟示

5.1 超越試誤法

極簡主義者和迭代精煉者路徑的普遍性凸顯了一個關鍵缺口。若放任學生自行摸索,大多數人不會自發地發展出成熟的提示工程策略。他們的過程效率低下,且往往未能充分利用AI的全部能力,甚至可能強化被動學習的習慣。

5.2 教學整合

本研究主張在EFL寫作課堂中進行明確的提示工程教育。這應包括:

  • 直接教學: 教授提示的組成部分(角色、任務、情境、限制條件、範例)。
  • 結構化框架: 引入如RTF(角色、任務、格式)或CRISPE(能力、角色、洞察、陳述、個性、實驗)等模型。
  • 批判與分析: 評估AI生成的輸出,以理解提示與產出之間的因果關係。
  • 倫理考量: 討論著作權、抄襲以及對AI內容的批判性評估。

目標是培養學生成為AI生成文本的策略性指揮者,而非被動消費者

6. 技術分析與框架

核心洞見、邏輯流程、優缺點、可行建議

核心洞見: 本文揭示了一個關鍵且常被忽略的事實:如ChatGPT這類AI工具的普及,並不會自動帶來能力的普及化。介面看似簡單,但有效互動所需的認知負荷很高。「AI輔助課堂」的真正瓶頸並非技術的取得,而是互動素養的缺乏。本研究巧妙地將焦點從AI的輸出轉移到人類的輸入,揭露了原始、未經修飾的學習曲線。

邏輯流程: 論證方法嚴謹且具說服力。首先確立問題(頂尖聊天機器人需要熟練的提示),引入知識缺口(新手實際上如何操作?),呈現細緻的實證證據(四種路徑),最後提出有力的行動呼籲(教育必須適應)。個案研究的運用將理論紮根於複雜的現實中。

優缺點: 主要優勢在於其生態效度。使用首次使用者在真實任務情境下的螢幕錄影,提供了實驗室研究往往缺乏的真實資料。四路徑類型學直觀且為教育工作者診斷學生行為提供了有力的框架。主要缺點,如作者所承認的,是規模問題。這是一項深度個案研究,而非廣泛調查。這些路徑是說明性的,無法進行統計推論。此外,本研究聚焦於過程,並未嚴格測量不同路徑下最終書面產品的品質——這是關鍵的下一步。

可行建議: 對教育工作者和課程設計者而言,本文是一記警鐘。它提供了一個明確的指令:提示工程是21世紀的核心素養,必須被教授,而非自然習得。 學校應開發整合如提示層級模型等框架的微型課程,該模型從基本指令提示($P_{cmd}$)進階到複雜的迭代推理提示($P_{reason}$)。例如,教導學生高品質提示的公式:$P_{optimal} = R + T + C + E$,其中$R$是角色,$T$是任務,$C$是限制條件,$E$是範例。教育科技公司應將這些教學鷹架直接建構於其介面中,提供引導式提示建構模板和回饋,超越空白的文字輸入框。

技術細節與數學公式

從機器學習的角度來看,使用者的提示$p$是語言模型$M$的條件脈絡。模型基於機率分佈$P(o | p, \theta)$生成輸出序列$o$,其中$\theta$代表模型的參數。有效的提示能降低此輸出分佈的熵,將其導向使用者的預期目標$t$。學生的挑戰在於最小化可能輸出的分佈與其目標之間的差異,形式化為最小化$D_{KL}(P(o|p, \theta) \,||\, P(o|t))$,其中$D_{KL}$是Kullback–Leibler散度。新手使用者透過試誤法,正在對$p$進行一種粗略的、人在迴路中的最佳化以達成此目標。

分析框架範例個案

情境: 一名學生必須寫一封說服信給校長,建議啟動回收計畫。

極簡主義者路徑(無效):
提示 1: 「寫一封關於回收的信。」
輸出:一封通用、平淡的信。
學生行動: 對輸出進行微小編輯後提交。

結構化規劃者路徑(有效 - 使用RTF框架):
提示 1: 「扮演一名關切的十年級學生。寫一封正式的說服信給高中校長。目標是說服他們在食堂和教室實施全面的塑膠和紙類回收計畫。使用尊重但緊迫的語氣。包含三個論點:1) 環境影響,2) 學生參與/領導機會,3) 潛在的成本節省或補助金。以日期、稱謂、每個論點的主體段落以及結尾簽名來格式化這封信。」
輸出:一封結構良好、目標明確且有說服力的信。
學生行動: 審視輸出,可能會要求精煉:「透過增加一個統計數據來強化第三個關於成本節省的論點。」

這個對比展示了應用簡單的結構化框架(角色:學生,任務:寫信,格式:正式並包含特定論點)如何顯著提升AI協作的效率與品質。

實驗結果與圖表描述

本研究的關鍵結果是質性的,體現在路徑描述中。一個假設的量化延伸可能產生如下圖表:「圖1:各路徑的互動效率與輸出品質。」 X軸代表提示輪次數量(效率的倒數),Y軸代表最終文本的品質分數(例如,透過評分量表評估)。我們預期:
- 極簡主義者 會聚集在高效率(低輪次)但低品質的象限。
- 迭代精煉者 會顯示中到高輪次,品質不一。
- 結構化規劃者 會佔據高效率、高品質的象限(低輪次,高分數)。
- 對話探索者 會處於低效率(高輪次)象限,品質不一,若探索有焦點則可能較高。此視覺化將有力地論證結構化規劃者路徑代表了教學的最佳目標。

7. 未來應用與方向

本研究的影响超越了EFL課堂:

  • 適應性提示輔導系統: 開發AI驅動的輔導系統,分析學生的提示歷史,診斷其路徑,並提供即時、有鷹架的回饋,引導他們採用更有效的策略(例如,「請在下一個提示中指定你的受眾」)。
  • 跨學科素養: 將提示工程整合到STEM教育中,用於程式碼生成、資料分析查詢和科學解釋,正如麻省理工學院RAISE倡議等機構所倡導的。
  • 職場準備: 正如世界經濟論壇報告所指出的,提示工程正迅速成為各行業重視的技能。中學教育必須為學生應對這一現實做好準備。
  • 縱貫性研究: 追蹤提示工程技能在教學下隨時間的發展,以及它們如何與傳統寫作和批判性思維技能的提升相關聯。
  • 多模態提示: 未來研究必須探索針對多模態AI(例如DALL-E、Sora)的提示工程,其中指令涉及視覺、時間和風格限制——這是一個更複雜的素養前沿。

8. 參考文獻

  1. Caldarini, G., Jaf, S., & McGarry, K. (2022). A Literature Survey of Recent Advances in Chatbots. Information, 13(1), 41.
  2. Woo, D. J., Guo, K., & Susanto, H. (2023). Cases of EFL Secondary Students’ Prompt Engineering Pathways to Complete a Writing Task with ChatGPT. [手稿準備中].
  3. Zhao, W. X., et al. (2023). A Survey of Large Language Models. arXiv preprint arXiv:2303.18223.
  4. Moor, J. (2006). The Dartmouth College Artificial Intelligence Conference: The Next Fifty Years. AI Magazine, 27(4), 87–91.
  5. MIT RAISE. (2023). Day of AI Curriculum. Massachusetts Institute of Technology. 取自 [https://www.dayofai.org/]
  6. World Economic Forum. (2023). Future of Jobs Report 2023.
  7. Reynolds, L., & McDonell, K. (2021). Prompt Programming for Large Language Models: Beyond the Few-Shot Paradigm. Extended Abstracts of the 2021 CHI Conference on Human Factors in Computing Systems.