找回密码
 注册

微信登录

微信扫一扫,快速登录

查看: 257|回复: 0

AI在设计系统中为何失败,以及我们如何善用AI

[复制链接]
发表于 2025-9-1 01:47 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
来源:Bencallahan.com

日期:2025年8月25日

翻译:沫伊子

对于一个设计系统项目而言,我们的目标通常是产出稳定、高品质、经久耐用的成果。那么,我们能容忍自己的工具在多大程度上存在不稳定性、低质量或短暂性呢?这正是Nathan Curtis和我为《The Question》第60集,向设计系统社群提出的核心问题。

2025年8月21日,Nathan与我共同主持了一场深度讨论,围绕我们从95位设计系统从业者那里收集到的数据展开。我们只问了两个简单的问题:

1、贵组织是否期待在不久的将来,能利用AI来完成数字界面的生产工作?

2、在您的日常工作中,AI在哪方面因不够精确而让您感到力不从心?

不出所料,答案复杂而多样。在讨论中,我们都认同,AI在我们工作流程的某些环节表现卓越,但在另一些环节则相当糟糕。结果发现,AI在设计系统中遭遇的瓶颈,或许正是我们对AI的理解和使用方式出了问题。

组织层面的困境

许多人在尝试将AI融入设计系统时,发现AI本质上概率性的输出,与我们系统必须提供的确定性承诺发生了激烈碰撞。我们把设计系统看作是一份契约——一份对用户做出的质量保证。而那些正在颠覆我们各个工作领域的大型语言模型,天生就是速度极快、擅长“猜”答案的工具。但我们的承诺,可不是“猜测”。

Jesse对此深有感触:“我们[IT]团队需要的是确定性系统所能提供的安全保障,这使得那些随机性的响应……从安全角度来说……很难被接受。”

虽然“安全保障”这个词不完全等同于设计系统,但它很好地映射了设计系统最擅长的核心:建立可靠的模式、经过严格测试的代码和统一的语言,这些都是产品团队信任的基础。当你将AI引入工作流,它每次生成的结果都可能千差万别。这种不一致性,自然就削弱了信任。

确定性契约与概率性助手之间的平衡

Nathan提出了一种“兼顾”的观点——使用AI,但坚守契约的确定性:“这种在预测性随机行为与确定性规范之间寻求平衡,正是我们工作的核心……我可能会用AI来预测数据,但系统本身仍需有明确的规格。”

他说得没错——我们的工作重心正在从巧妙编写提示词,转向构建复杂的上下文环境。有人称之为上下文工程(context engineering),这可不是小事。如果你曾嘲笑“写提示词”也能成为全职工作(我当时也这么想),那么这个概念完全不同。

上下文工程通常是指建立一套完整的系统,来组织必要的数据、边界、指令、输出格式等,从而让AI的产出变得可控。可以想象,这些上下文工程系统本身也需要经过测试和版本迭代,尤其当其上下文信息随时间变化时。这无疑会给本已繁重的RACI(责任分配矩阵)再添新负担。当然,这工作量是巨大的。而正是在这一点上,我们的讨论开始转向了AI在哪些方面容易成功,又在哪些方面困难重重。

精准度的光谱

当我浏览原始数据时,我开始在大家分享的AI成功与失败案例中发现一个规律。你们中的大多数人可能都熟悉双菱形设计流程(Double Diamond design process)。

w1.jpg

“双菱形是设计与创新过程的视觉化呈现。它简洁地描述了任何设计与创新项目所采取的步骤,与所用的方法和工具无关。两个菱形分别代表了更广泛或更深入地探索问题(发散性思维)的过程,以及随后采取集中行动(收敛性思维)的过程。”

双菱形设计过程——在菱形的发散性一侧,利用AI获得成功似乎比在收敛性一侧容易得多。

我从大家的回答中看到的规律是,让当前这一代AI工具协助处理发散性任务要容易得多,而要让AI为收敛性任务提供令人满意的结果则挑战重重。

在左侧(发散),不精确通常是可以接受的,甚至是有益的。但在右侧(收敛),则完全不可接受。从原始数据中,我听到了以下声音:

发散性,AI已见成效的领域:这包括头脑风暴、笔记归纳、研究辅助、临时性原型制作以及重复性或低风险任务。一位受访者总结:“它确实提供了一个快速的起点,并能自动化一些重复性的工作。”(匿名调查回复)

收敛性,AI导致信任破裂的领域:这包括生成生产级代码、严格遵循设计系统规范、像素级的视觉决策以及需要可复现性的任务。正如一位受访者所说:“目前没有人敢相信它能直接写出可发布的生产代码,没有经过适当的审查和测试是万万不行的。”(匿名调查回复)

其他原始数据也印证了这一模式:“Figma Make无法遵守我们的设计系统……即使提示它这样做也不行。”还有人提到:“我们只达到了大约80%的准确性……低于100%对我们来说没有意义。”(匿名调查回复)

谈到组件生成,一位受访者直言不讳:“它在生成新组件时会产生可疑的结果……比如生成双API,或是不符合理想的TypeScript实践。”(匿名调查回复)

但大家也分享了AI的正面作用:“AI作为搜索引擎和提炼最佳实践的工具非常出色,”一位受访者写道,另一位则表示,AI“正帮助我们自动化那些简单的工作,加快了我们的工作流程。”(匿名调查回复)

在AI已见成效的地方靠拢,在尚未成熟的地方尝试

综合讨论、调查和工作笔记,我得出了一个简单的模型:

在AI表现良好的地方靠拢

1、探索与发现(头脑风暴、研究、竞品分析)

2、总结与草稿(高层次的归纳、会议和笔记摘要)

3、结构化重构(批量重命名、Token差异报告、有明确规范的CSS清理)

4、低风险原型(用于讨论方案的快速流程,而不是用于获取可用性验证)

在AI尚不成熟(但值得尝试)的地方实验

1、设计系统保真度(“组件/令牌必须精确无误”)

2、生产代码(“可复现性比新颖性更重要”)

3、像素级视觉决策(“AI在品牌语言和留白判断上依然失败”)

4、一致性与可重复性(“即使多次输入相同的提示,AI也会给出不同结果”)

如何在这两方面给予支持:

5、上下文分层(MCP, RAG, 开放代码库访问,让模型能看到你的系统,而非来自网络的通用信息)

6、契约测试(模式检查、令牌静态检查、视觉差异对比等)

7、去除偏好(基于人类偏好进行的优化,不总能带来好的结果)
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-9-26 06:06 , Processed in 0.104209 second(s), 31 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表