选择语言

探究EFL学生如何利用自然语言生成工具进行创意写作构思

本研究探讨了将英语作为外语的学生如何运用自然语言生成工具进行创意写作构思,涵盖其使用策略、评估方法及工具选择标准。
learn-en.org | PDF Size: 1.5 MB
评分: 4.5/5
您的评分
您已经为此文档评过分
PDF文档封面 - 探究EFL学生如何利用自然语言生成工具进行创意写作构思

1. 引言

本研究旨在探究将英语作为外语(EFL)的学生如何利用自然语言生成(NLG)工具进行创意写作构思。写作是沟通和学术成功的基础技能,对EFL学习者而言尤其具有挑战性。创意写作具有独特的益处,包括个人知识建构和有意义见解的形成。人工智能驱动的NLG工具在教育领域的整合,带来了新的机遇与挑战。

本研究旨在填补一个重要空白:理解EFL学生在创意过程中如何与NLG工具互动,具体考察他们搜索、评估和选择这些工具生成构思的策略。

2. 研究方法

本研究采用定性研究设计,研究对象为香港四名中学生。参与者参加了工作坊,学习使用自己的语言和NLG生成的内容来创作故事。工作坊结束后,学生们完成了关于其体验的书面反思。

数据分析采用主题分析法,以识别学生与NLG工具互动中的模式和策略。研究重点集中在三个主要方面:搜索策略、评估方法和工具选择标准。

3. 结果与发现

3.1 构思搜索策略

学生们表现出,他们通常带着已有的想法或主题方向来使用NLG工具。他们并非利用工具进行完全开放式的灵感激发,而是用其来扩展、完善或寻找初始概念的变体。这表明他们的搜索行为是引导式的,而非探索式的。

3.2 构思评估

一个值得注意的发现是,学生对完全由NLG工具生成的构思表现出排斥或怀疑态度。他们更倾向于将AI生成的内容与自己原创的想法相结合,这表明他们希望保持作者身份和创作主导权。评估标准包括相关性、原创性(感知到的人性化特质)以及与预期叙事的一致性。

3.3 工具选择标准

在选择不同的NLG工具或提示词时,学生倾向于选择能产生更多构思的选项。这种“数量优先于初始质量”的方法为他们提供了更广泛的原始材料库,供其筛选和改编,这与创意写作的头脑风暴阶段相吻合。

4. 讨论

研究结果表明,EFL学生并非将NLG工具视为自主的构思创造者,而是将其作为协作伙伴或构思放大器。观察到的对纯AI生成内容的排斥,突显了学生在创意过程中保持能动性的重要性。这些见解对于寻求将AI工具有效整合到写作课程中的教育工作者至关重要,强调了需要制定教学策略,以教授对AI生成内容进行批判性评估和综合的能力。

本研究强调了NLG工具在降低第二语言构思认知负荷方面的潜力,可能有助于缓解写作障碍并提高参与度。

5. 技术框架与分析

核心见解:本文并非旨在构建更好的NLG模型;它是一项至关重要的人机交互(HCI)研究,揭示了教育AI中的“最后一公里问题”。真正的瓶颈并非AI生成文本的能力——像GPT-4这样的现代模型已精于此道。挑战在于用户,尤其是EFL学习者,有效提示、批判性评估并创造性整合AI输出的能力。研究表明,学生并非将NLG视为神谕,而是作为头脑风暴伙伴,偏爱那些能产生大量、低承诺度构思以供筛选的工具——这种行为类似于作家使用传统灵感板的方式。

逻辑脉络:研究逻辑合理但有限。它正确地指出了NLG能力与教学应用之间的差距。研究从观察行为(学生使用工具)推进到推断策略(引导式搜索、评估性排斥)。然而,它未能建立一个坚实的理论框架。它暗示了认知负荷理论(NLG降低第二语言构思的努力)和维果茨基的最近发展区(AI作为脚手架)等概念,但并未明确将研究发现植根于这些理论,错失了获得更深层解释力的机会。

优势与不足:优势在于其扎根的、定性的研究方法,在真实的学习情境中研究真实的学生——这在早期教育技术AI研究中是罕见的,该领域通常由技术概念验证主导。主要不足在于规模。仅有四名参与者,研究发现具有启发性,但无法推广。这是一项引人注目的试点研究,而非权威指南。此外,它将“NLG工具”视为一个整体,没有剖析基于模板的、提示驱动的或微调模型之间的差异,而这些差异会显著影响用户策略。与《CycleGAN》论文(Zhu等人,2017)等基础性工作相比,后者提出了一种具有清晰、可衡量结果的新颖技术架构,而本研究的贡献是社会学层面的,而非算法层面的。

可操作的见解:对于教育工作者:不要只是简单地将AI工具引入课堂。设计结构化的活动,教授“提示素养”——如何向AI提出富有成效的问题——以及“输出分诊”——如何批判性地评估并融合AI建议。对于开发者:为教育领域构建NLG工具时,设计支持迭代优化的界面(例如,“生成更多类似内容”、“简化语言”、“使其更暗”),并提供解释AI为何做出特定建议的元数据,超越黑箱生成。未来不在于更流畅的AI,而在于更具教学智慧的人机协作框架。

技术细节与数学表述

核心过程可以抽象化。设学生内部的构思状态表示为向量 Is。一个NLG工具,基于提示 p,生成一组构思变体 {Iai,1, Iai,2, ..., Iai,n}。学生的评估和选择函数 feval 作用于这些变体,通常寻求最小化距离度量 d(Is, Iai),同时最大化新颖性度量 N(Iai)。最终采纳的构思是融合的结果:Ifinal = g(Is, Iai,selected),其中 g 是学生特定的组合函数。

研究中关于数量偏好的发现表明,学生正在优化,以提高找到满足 d(Is, Iai) < θ(个人阈值)的 Iai 的概率,因此偏爱能产生更大 n 的工具。

分析框架示例案例

场景: 一名EFL学生想写一个关于“森林中迷路的机器人”的故事。

无结构化框架:
学生提示NLG:“写一个关于机器人在森林中迷路的故事。”得到一个冗长、通用的故事。学生感到不知所措或缺乏灵感,不喜欢AI的叙事口吻。

采用教学框架(基于本研究):
1. 构思扩展: 学生提示获取组件:“生成10个描述未来主义森林的词语”和“列出迷路机器人的5种情绪状态。”(利用数量偏好)。
2. 评估与选择: 学生从列表A中选择3个词(“生物发光的”、“过度生长的”、“寂静的”),从列表B中选择2种状态(“好奇的”、“孤独的”)。(应用批判性分诊)。
3. 融合: 学生写道:“在寂静的、生物发光的森林里,机器人感到一种深深的孤独,夹杂着好奇。”(将AI输出与个人句法及叙事控制相融合)。
此框架将研究中观察到的有效行为系统化。

实验结果与图表描述

定性数据暗示了在更大规模研究中可量化的行为模式。一个假设的条形图将显示:
- Y轴: 策略使用频率。
- X轴: 策略类别:“引导式搜索(有预设构思)”、“开放式探索”、“偏爱高数量输出”、“对AI构思表示怀疑”、“融合AI与自身构思”。
- 结果: “引导式搜索”、“偏爱高数量输出”和“融合AI与自身构思”的条形将显著高于“开放式探索”,表明学生将NLG作为增强工具而非替代品所采取的主导性、实用主义方法。

主要的“结果”是源自学生反思的主题图,它揭示了寻求创意辅助与保持作者主导权之间的核心矛盾。

6. 未来应用与方向

短期(1-3年): 为Google Docs或Word等平台开发专门的教育NLG插件,提供支架式提示(例如,“头脑风暴角色”、“用感官描述一个场景”),并与形成性评估工具集成,为人机协作撰写的文本的创造性和连贯性提供反馈。

中期(3-5年): “自适应构思伙伴”——能够学习个体学生创意偏好、喜爱体裁和语言能力水平的AI系统,动态调整构思建议和词汇支持,充当个性化写作导师。

长期(5年以上): 与沉浸式技术融合。利用NLG结合多模态AI,在VR/AR环境中生成动态故事世界,其中叙事根据学生的写作选择而调整,为练习叙事构建和描述性语言创造一个深度参与的反馈循环。

关键的研究方向是进行纵向研究,探讨持续使用NLG工具如何影响EFL学习者原创性思维和写作能力的发展,确保这些工具是增强而非削弱其基础技能。

7. 参考文献

  1. Woo, D. J., Wang, Y., Susanto, H., & Guo, K. (2023). Understanding EFL Students’ Idea Generation Strategies for Creative Writing with NLG Tools. Manuscript in preparation.
  2. Graham, S., & Perin, D. (2007). A meta-analysis of writing instruction for adolescent students. Journal of Educational Psychology, 99(3), 445–476.
  3. Kaufman, J. C., & Beghetto, R. A. (2009). Beyond big and little: The four c model of creativity. Review of General Psychology, 13(1), 1–12.
  4. Dawson, P. (2005). Creative Writing and the New Humanities. Routledge.
  5. Zhu, J.-Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. Proceedings of the IEEE International Conference on Computer Vision (ICCV).
  6. OpenAI. (2023). GPT-4 Technical Report. arXiv preprint arXiv:2303.08774.
  7. Swanson, H. L., & Berninger, V. W. (1996). Individual differences in children's working memory and writing skill. Journal of Experimental Child Psychology, 63(2), 358–385. (For cognitive load theory context).