① RAG的容错: 现在很多问答产品都用了RAG(检索增强生成),就是先从知识库里检索相关文档,再让模型基于这些文档来回答。一个常见的问题是,如果知识库里没有相关内容,怎么办?一个糟糕的设计是,模型可能会基于自己的通用知识胡编乱造,或者直接说“我不知道”。一个好的设计是,系统能明确地告诉用户:“根据我查阅的XX文档,没有找到关于您问题的直接信息。不过,根据通用知识,这个问题可能与YY有关……” 这种诚实的、有边界感的回答,能极大地提升用户的信任感。
② 风控拦截: 如果用户诱导模型输出违规内容,或者模型自己“发疯”,生成了不当言论,怎么办?你必须有一套风控拦截机制。这可能是一个前置的关键词过滤器,也可能是一个后置的、专门用于内容审核的小模型。当检测到风险时,系统应该立刻拦截输出,并给出一个预设的、安全的、模糊的回答,比如“我们换个话题聊聊吧”。在作品集里画出你的内容安全审核流程,是体现你责任感和成熟度的重要一环。
8. 延迟感知的体验设计
① 流式输出(Streaming): 这是最基本,也最有效的策略。不要等模型生成完所有内容再一股脑地显示出来。而应该像打字机一样,一个字一个字地“流”出来。这不仅能让用户立即看到系统正在“思考”和“工作”,极大地缓解了等待的焦虑感,还能让用户在内容生成到一半时,如果发现方向不对,可以随时打断,节省了时间和计算资源。
② 骨架屏(Skeleton Screen): 在等待模型返回结果的空白期,可以先展示一个内容的“骨架”。比如,如果用户要的是一份报告,你可以先展示出报告的标题、各个章节的标题,内容部分用灰色的占位符填充。这给了用户一个稳定的预期,让他们知道即将生成的内容大概是什么结构,体验比一个空白页面或者一个旋转的菊花好得多。
③ 预加载与乐观更新: 在某些场景下,你甚至可以预测用户的下一步行为,并提前开始加载。比如,在一个多轮对话的引导流程里,当用户选择了某个选项后,你可以“乐观地”假设他会继续下去,并提前开始为下一步生成内容。这种策略虽然有一定风险,但在特定场景下能创造出“瞬时响应”的惊艳体验。