AI在设计系统中为何失败,以及我们如何善用AI

我爱免费 · 发表于 2025-9-1 00:47

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

×

作者：微信文章
来源：Bencallahan.com

日期：2025年8月25日

翻译：沫伊子

对于一个设计系统项目而言，我们的目标通常是产出稳定、高品质、经久耐用的成果。那么，我们能容忍自己的工具在多大程度上存在不稳定性、低质量或短暂性呢？这正是Nathan Curtis和我为《The Question》第60集，向设计系统社群提出的核心问题。

2025年8月21日，Nathan与我共同主持了一场深度讨论，围绕我们从95位设计系统从业者那里收集到的数据展开。我们只问了两个简单的问题：

1、贵组织是否期待在不久的将来，能利用AI来完成数字界面的生产工作？

2、在您的日常工作中，AI在哪方面因不够精确而让您感到力不从心？

不出所料，答案复杂而多样。在讨论中，我们都认同，AI在我们工作流程的某些环节表现卓越，但在另一些环节则相当糟糕。结果发现，AI在设计系统中遭遇的瓶颈，或许正是我们对AI的理解和使用方式出了问题。

组织层面的困境

许多人在尝试将AI融入设计系统时，发现AI本质上概率性的输出，与我们系统必须提供的确定性承诺发生了激烈碰撞。我们把设计系统看作是一份契约——一份对用户做出的质量保证。而那些正在颠覆我们各个工作领域的大型语言模型，天生就是速度极快、擅长“猜”答案的工具。但我们的承诺，可不是“猜测”。

Jesse对此深有感触：“我们[IT]团队需要的是确定性系统所能提供的安全保障，这使得那些随机性的响应……从安全角度来说……很难被接受。”

虽然“安全保障”这个词不完全等同于设计系统，但它很好地映射了设计系统最擅长的核心：建立可靠的模式、经过严格测试的代码和统一的语言，这些都是产品团队信任的基础。当你将AI引入工作流，它每次生成的结果都可能千差万别。这种不一致性，自然就削弱了信任。

确定性契约与概率性助手之间的平衡

Nathan提出了一种“兼顾”的观点——使用AI，但坚守契约的确定性：“这种在预测性随机行为与确定性规范之间寻求平衡，正是我们工作的核心……我可能会用AI来预测数据，但系统本身仍需有明确的规格。”

他说得没错——我们的工作重心正在从巧妙编写提示词，转向构建复杂的上下文环境。有人称之为上下文工程（context engineering），这可不是小事。如果你曾嘲笑“写提示词”也能成为全职工作（我当时也这么想），那么这个概念完全不同。

上下文工程通常是指建立一套完整的系统，来组织必要的数据、边界、指令、输出格式等，从而让AI的产出变得可控。可以想象，这些上下文工程系统本身也需要经过测试和版本迭代，尤其当其上下文信息随时间变化时。这无疑会给本已繁重的RACI（责任分配矩阵）再添新负担。当然，这工作量是巨大的。而正是在这一点上，我们的讨论开始转向了AI在哪些方面容易成功，又在哪些方面困难重重。

精准度的光谱

当我浏览原始数据时，我开始在大家分享的AI成功与失败案例中发现一个规律。你们中的大多数人可能都熟悉双菱形设计流程（Double Diamond design process）。

“双菱形是设计与创新过程的视觉化呈现。它简洁地描述了任何设计与创新项目所采取的步骤，与所用的方法和工具无关。两个菱形分别代表了更广泛或更深入地探索问题（发散性思维）的过程，以及随后采取集中行动（收敛性思维）的过程。”

双菱形设计过程——在菱形的发散性一侧，利用AI获得成功似乎比在收敛性一侧容易得多。

我从大家的回答中看到的规律是，让当前这一代AI工具协助处理发散性任务要容易得多，而要让AI为收敛性任务提供令人满意的结果则挑战重重。

在左侧（发散），不精确通常是可以接受的，甚至是有益的。但在右侧（收敛），则完全不可接受。从原始数据中，我听到了以下声音：

发散性，AI已见成效的领域：这包括头脑风暴、笔记归纳、研究辅助、临时性原型制作以及重复性或低风险任务。一位受访者总结：“它确实提供了一个快速的起点，并能自动化一些重复性的工作。”（匿名调查回复）

收敛性，AI导致信任破裂的领域：这包括生成生产级代码、严格遵循设计系统规范、像素级的视觉决策以及需要可复现性的任务。正如一位受访者所说：“目前没有人敢相信它能直接写出可发布的生产代码，没有经过适当的审查和测试是万万不行的。”（匿名调查回复）

其他原始数据也印证了这一模式：“Figma Make无法遵守我们的设计系统……即使提示它这样做也不行。”还有人提到：“我们只达到了大约80%的准确性……低于100%对我们来说没有意义。”（匿名调查回复）

谈到组件生成，一位受访者直言不讳：“它在生成新组件时会产生可疑的结果……比如生成双API，或是不符合理想的TypeScript实践。”（匿名调查回复）

但大家也分享了AI的正面作用：“AI作为搜索引擎和提炼最佳实践的工具非常出色，”一位受访者写道，另一位则表示，AI“正帮助我们自动化那些简单的工作，加快了我们的工作流程。”（匿名调查回复）

在AI已见成效的地方靠拢，在尚未成熟的地方尝试

综合讨论、调查和工作笔记，我得出了一个简单的模型：

在AI表现良好的地方靠拢

1、探索与发现（头脑风暴、研究、竞品分析）

2、总结与草稿（高层次的归纳、会议和笔记摘要）

3、结构化重构（批量重命名、Token差异报告、有明确规范的CSS清理）

4、低风险原型（用于讨论方案的快速流程，而不是用于获取可用性验证）

在AI尚不成熟（但值得尝试）的地方实验

1、设计系统保真度（“组件/令牌必须精确无误”）

2、生产代码（“可复现性比新颖性更重要”）

3、像素级视觉决策（“AI在品牌语言和留白判断上依然失败”）

4、一致性与可重复性（“即使多次输入相同的提示，AI也会给出不同结果”）

如何在这两方面给予支持：

5、上下文分层（MCP, RAG, 开放代码库访问，让模型能看到你的系统，而非来自网络的通用信息）

6、契约测试（模式检查、令牌静态检查、视觉差异对比等）

7、去除偏好（基于人类偏好进行的优化，不总能带来好的结果）

账号		自动登录	找回密码
密码			注册

AI在设计系统中为何失败,以及我们如何善用AI

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

浏览过的版块