2.1 顶尖聊天机器人的兴起
以ChatGPT为代表的顶尖生成式人工智能聊天机器人,代表了相对于基于规则的前代产品的巨大飞跃。它们由在海量语料库上训练的神经网络语言模型驱动,基于概率预测生成类人文本,从而实现更灵活、更具情境感知的交互(Caldarini等人,2022)。“ChatGPT”正日益被用作此类人工智能的通用术语,树立了新的性能标准。
ChatGPT的空前流行标志着个人为教育目的与技术互动方式的范式转变。本文研究了英语作为外语的中学生中新兴的提示工程技能。尽管像ChatGPT这样的大语言模型为写作能力发展提供了巨大潜力,但其效能取决于用户能否设计出精确、有效的指令。本研究捕捉了新手用户的实时试错过程,分析了他们为完成特定写作任务所使用提示的内容、质量及演变。研究结果揭示了不同的行为路径,强调了在EFL课程中开展结构化提示工程教育的紧迫性,以引导学生从低效的尝试转向与人工智能的战略协作。
以ChatGPT为代表的顶尖生成式人工智能聊天机器人,代表了相对于基于规则的前代产品的巨大飞跃。它们由在海量语料库上训练的神经网络语言模型驱动,基于概率预测生成类人文本,从而实现更灵活、更具情境感知的交互(Caldarini等人,2022)。“ChatGPT”正日益被用作此类人工智能的通用术语,树立了新的性能标准。
提示工程是设计输入以引导大语言模型产生期望输出的艺术与科学。它不仅仅是一项技术技能,更是一种计算思维和元语言意识。有效的提示通常需要清晰度、上下文、约束条件和示例(少样本学习)。对于非技术用户而言,这带来了显著的学习曲线,其特点往往是迭代式的猜测。
关于人工智能在语言学习中的研究主要集中在自动写作评估和智能辅导系统上。顶尖聊天机器人的交互式、生成式特性引入了一种新的动态——将学习者的角色从反馈接收者转变为认知工具的指挥者。这需要融合传统写作技能与人工智能交互策略的新素养。
本研究涉及香港的中学EFL学生,他们此前没有使用顶尖聊天机器人的经验。参与者的任务是使用ChatGPT完成一项特定的写作作业(例如,一篇议论文或描述性段落)。主要数据包括iPad屏幕录像,记录了完整的提示序列、ChatGPT的回复以及学生所做的任何修改。
本研究采用了定性案例研究方法。屏幕录像被转录并沿两个主要维度进行编码:(1)提示内容(例如,任务说明、风格要求、修改指令)和(2)交互模式(例如,对话轮次、基于输出的调整)。对模式进行聚类以识别不同的用户路径。
对屏幕录像的分析揭示了四种典型路径,代表了不同策略方法和提示复杂度的组合。
基于对群体中观察到的模式。
这些用户输入非常简短,通常是反映原始任务指令的单句提示(例如,“写一篇关于气候变化的文章”)。他们对迭代的容忍度很低;如果初始输出不令人满意,他们很可能会放弃该工具或提交质量不佳的结果。这条路径反映了一种工具即神谕的误解。
这个群体从一个简单的提示开始,但会进行线性的优化过程。基于人工智能的输出,他们发出后续指令,如“写长一点”、“用更简单的词”或“添加更多例子”。交互是反应式和渐进式的,表明了对人工智能对指令响应性的初步理解,但缺乏整体规划。
少数学生以预先构思的结构来处理任务。他们的初始提示非常全面,指定了格式、语气、要点,有时还提供大纲(例如,“写一篇5段式议论文,论证可再生能源。第1段:引言。第2段:经济效益……使用正式语气。”)。这条路径能以更少的对话轮次产生更高质量的输出,表明了高级的任务分解和元认知规划能力。
这些用户将ChatGPT视为对话伙伴。他们不只是发出指令,还会提出元问题(“我如何改进我的论点陈述?”)或请求解释(“你为什么选择这个词?”)。这条路径将写作辅助与写作学习相结合,尽管它可能会偏离主题,并且可能无法高效完成核心任务。
极简主义者和迭代优化者路径的普遍性突显了一个关键差距。如果任其自行发展,大多数学生不会自发形成复杂的提示工程策略。他们的过程效率低下,往往无法充分利用人工智能的全部能力,可能还会强化被动的学习习惯。
本研究主张在EFL写作课堂中进行明确的提示工程教育。这应包括:
目标是培养能够成为人工智能生成文本的战略指挥者,而非被动消费者的学生。
核心洞察: 本文揭示了一个关键且常被忽视的事实:像ChatGPT这样的人工智能工具的普及,并不会自动带来能力的普及。其界面看似简单,但有效交互的认知负荷很高。“人工智能增强课堂”的真正瓶颈并非技术获取,而是缺乏交互素养。本研究巧妙地将焦点从人工智能的输出转移到人类的输入,揭示了原始、未经修饰的学习曲线。
逻辑脉络: 论证过程条理清晰且具有说服力。它首先确立问题(顶尖聊天机器人需要熟练的提示),引入知识缺口(新手实际上如何操作?),呈现细致的实证证据(四种路径),并以强有力的行动呼吁(教育必须适应)作结。案例研究的运用将理论扎根于复杂的现实之中。
优势与不足: 主要优势在于其生态效度。使用首次用户在真实任务情境下的屏幕录像,提供了实验室研究往往缺乏的真实数据。四种路径的类型学直观易懂,为教育工作者诊断学生行为提供了一个强大的框架。主要不足,正如作者所承认的,在于规模。这是一项深入的案例研究,而非广泛的调查。这些路径是说明性的,不具备统计上的普遍性。此外,研究侧重于过程,并未严格测量不同路径下最终书面成品的质量——这是关键的下一步。
可行建议: 对于教育工作者和课程设计者而言,本文是一记警钟。它提供了一个明确的指令:提示工程是21世纪的核心素养,必须被教授,而非自然习得。 学校应开发整合如提示层次模型等框架的微课程,该模型从基本指令提示($P_{cmd}$)过渡到复杂的迭代推理提示($P_{reason}$)。例如,教授学生高质量提示的公式:$P_{optimal} = R + T + C + E$,其中$R$是角色,$T$是任务,$C$是约束,$E$是示例。教育科技公司应将此类教学支架直接构建到其界面中,提供引导式提示构建模板和反馈,超越空白的文本框。
从机器学习的角度来看,用户的提示$p$充当了语言模型$M$的条件上下文。模型基于概率分布$P(o | p, \theta)$生成输出序列$o$,其中$\theta$代表模型的参数。一个有效的提示降低了此输出分布的熵,将其导向用户的预期目标$t$。学生面临的挑战是尽量减少可能输出的分布与其目标之间的差异,形式化为最小化$D_{KL}(P(o|p, \theta) \,||\, P(o|t))$,其中$D_{KL}$是Kullback–Leibler散度。新手用户通过试错法,正在对$p$进行一种粗略的、人在回路的优化以实现此目标。
场景: 一名学生必须就启动回收计划一事,给校长写一封有说服力的信。
极简主义者路径(低效):
提示 1: “写一封关于回收的信。”
输出:一封通用、平淡的信。
学生行动: 对输出稍作编辑后提交。
结构化规划者路径(高效 - 使用RTF框架):
提示 1: “扮演一名担忧的十年级学生。给一位高中校长写一封正式的有说服力的信。目标是说服他们在食堂和教室实施全面的塑料和纸张回收计划。使用尊重但紧迫的语气。包含三个论点:1) 环境影响,2) 学生参与/领导机会,3) 潜在的成本节约或拨款可能性。按照日期、称呼、每个论点对应的正文段落以及结尾签名的格式来写这封信。”
输出:一封结构良好、目标明确、有说服力的信。
学生行动: 审阅输出,可能会要求优化:“通过添加一个统计数据来加强关于成本节约的第三个论点。”
这种对比展示了应用一个简单的结构化框架(角色:学生,任务:写信,格式:正式并包含特定论点)如何显著提高人工智能协作的效率和产出质量。
本研究的关键结果是定性的,体现在路径描述中。一个假设的定量扩展可能会产生如下图表:“图1:各路径的交互效率与输出质量对比。” x轴将代表提示轮次数量(效率的倒数),y轴将代表最终文本的质量得分(例如,通过评分标准评估)。我们预期:
- 极简主义者 聚集在高效率(低轮次)但低质量的象限。
- 迭代优化者 显示出中等到高轮次,质量参差不齐。
- 结构化规划者 占据高效率、高质量的象限(低轮次,高得分)。
- 对话式探索者 处于低效率(高轮次)象限,质量参差不齐,如果探索聚焦则可能较高。这种可视化将有力地论证结构化规划者路径代表了教学的最佳目标。
本研究的意义超越了EFL课堂: