近期,美国达特茅斯医学院于《NPJ Digital Medicine》(影响因子 15.1)发表的一项研究,为该领域的发展提供了珍贵的真实世界证据。
研究团队在教学场景中实际部署了一款基于检索增强生成(RAG)技术的 AI 教学助手 ——NeuroBot TA。区别于标准大语言模型(LLM)依托通用数据的训练模式,NeuroBot TA 的数据库完全由教师提供的课程材料构建。当学生提出与课程内容相关的问题时,该系统会先从专属知识库中检索匹配的文本片段,将其与系统提示整合为具备完整上下文的查询指令,再传递至大语言模型进行处理。依托这一技术逻辑,模型能够基于课程专属材料生成回答,而非单纯依赖预训练阶段习得的通用知识。也正因如此,NeuroBot TA 的回答虽在内容范围上有所限定,却能保障信息的真实性与可靠性。
02
研究关键发现
(一)使用行为特征:医学生对 AI 助教的使用呈 “关键场景依赖” 模式
研究团队通过后台使用数据挖掘,发现医学生对 NeuroBot TA 的使用行为具有显著的场景指向性,核心特征如下:
1. 日常课程学习阶段使用频次较低,工具使用与课程压力高度相关;
2. 考前冲刺阶段使用量呈爆发式增长,较日常提升 329%;
3. 时间分布上,夜间使用量显著高于白天;
4. 使用高峰集中于课程压力较大的时段,尤以各类考试期间为核心节点。
(二)对话主题分布:聚焦课程核心内容理解,以 PPT 相关问题为主要诉求
对 AI 助教的对话主题进行分类统计后发现,学生的提问高度围绕课程核心知识,未涉及疾病治疗、病例诊断等超出课程范围的内容,核心主题及占比依次为:神经解剖与生理(65.9%)、临床疾病相关知识(53.7%)、学习资料定位(31.4%)、神经传导途径(29.6%)、课程与考试相关信息(28.4%)。