找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 295|回复: 0

AI助力质效双提升--群核质量效能AIGC探索进展分享

[复制链接]
发表于 2025-8-10 04:03 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
背景



基于25H1我们团队的目标方向,经过一段时间的实践探索,我们逐步看到了AI在测试效能领域的巨大潜力。在之前分享中杭州六小龙之群核科技--AI助力测试提效与大模型落地应用实践我们介绍了不少AI辅助测试的基础能力建设,包括FastQA平台建设。本篇重点介绍我们近期基于这些基建的最新进展,欢迎大家沟通讨论与使用。
一、质量效能AI Agent工具--助力测试提效

测试AI Agent建设,近期累计新增测试Agent 10+。

1.1 【AI测试分析】

Agent功能简介:

通过多轮自然语言对话实现全流程自动化测试分析,支持CF(Confluence,下同)链接识别、文档解析、报告优化等功能。

w1.jpg

Agent应用提效:

    自动化生成测试分析报告,人工干预减少80%

    上线后AI生成测试分析占比达21%

1.2 【AI用例生成】

Agent功能简介:

根据需求文档/测试描述一键生成功能测试用例,支持在线编辑。

w2.jpg

Agent应用提效:

    用例生成效率提升5倍

    上线后AI生成用例占比12.31%

1.3 【AI用例评审】

Agent功能简介:

基于规则库对用例批量评分并提供修改建议,保障用例质量。

w3.jpg

Agent应用提效:

    评审耗时缩短70%

    已覆盖所有评审单用例

1.4 【AI解析报错日志工具】

Agent功能简介:

解析KE渲染引擎报错日志,结合知识库提供故障原因和排查思路。

w4.jpg

w5.jpg

Agent应用提效:

    日志分析效率提升90%

    平均故障定位时间从2小时缩短至15分钟

1.5 【测试右移-AI日志聚合】

Agent功能简介:

聚合服务错误日志并可视化趋势,异常时触发预警。

w6.jpg

Agent应用提效:

    线上问题发现速度提升60%

    支持T+1日志分析

1.6 【AI查询解析引擎版本信息】

Agent功能简介:

通过自然语言提取环境信息,智能获取渲染引擎KE/Streaming版本数据。

w7.jpg

Agent应用提效:

    版本查询响应时间从分钟级降至秒级

    正与渲染定位工具集成形成智能定位体系

1.7 【AI辅助编写XPath】

Agent功能简介:

自动生成符合规范的xpath路径,支持校验与格式转换。

Agent应用提效:
w8.jpg


    日均生成20次,累计复制300+次

    UI自动化脚本稳定性提升35%

1.8 【AI测试文档评审/推荐】

Agent功能简介:

自动评审CF文档质量并推荐优质内容供团队学习。

w9.jpg

Agent应用提效:

    已评审10+篇复盘文档

    每周推送精选文档至部门群

1.9 【AI测试流程报告整合】

Agent功能简介:

聚合发布计划数据,自动生成标准化报告文档。

w10.jpg

Agent应用提效:

    发布信息整合效率提升50%

    已在多个敏捷组推广应用

1.10 【JSON Diff AI助手】

Agent功能简介:

智能分析JSON差异结果,支持规则编写(建设中)。

w11.jpg

Agent应用提效:

    上线3天完成400+次分析调用

    差异定位准确率达92%

1.11 【AI接口测试精准分析】

Agent功能简介:

结合CodeDiff数据智能识别测试关注点,自动生成异常case。

w12.jpg

Agent应用提效:

    测试场景覆盖率提升40%

    已应用于多个服务测试

1.12 【环境小助手】

Agent功能简介:

解答环境问题、分析调用链日志、查询负责人信息。

w13.jpg

Agent应用提效:

    环境问题响应速度提升80%

    支持自然语言查询

1.13 【AI工单分析】

Agent功能简介:

批量分析工单内容,输出共性质量改进建议。

w14.jpg

Agent应用提效:

    工单复盘效率提升60%

    已识别20+高频技术缺陷

1.14【搜索debug工具AI分析】

Agent功能简介:

基于参数和异常描述智能诊断搜索问题。

w15.jpg

Agent应用提效:

    近期使用90次

    问题分析准确率85%

1.15 【搜索失败词AI分析】

Agent功能简介:

通过语义分析定位搜索失败原因。

w16.jpg
二、测试模型微调与AI编码辅助


2.1 【模型调优提升图片对比能力】

微调目标:优化UI自动化测试中图像比对能力

    提升 UI自动化-图片对比结果准确率:当前图像对比算法识别为不通过的case,需要引入AI能力,减少误报率,提高case成功率

    减少 UI自动化结果分析成本:利用AI将图片对比的内容/细节进行语义化说明,输出规范的分析报告,降低人力投入
微调效果:解决了之前误报的问题,基本满足UI自动化中图纸图像比对分析需求


    微调前:
    w17.jpg



    微调后:
    w18.jpg


2.2 【UI自动化编码提效】

2.2.1 辅助UI自动化迁移

背景:云图软装业务交接到了新的敏捷组,相应UI自动化也交接过来。需要把对应10个自动化用例 js 文件以及依赖的函数、xpath、配置项,做仓库迁移。

迁移流程步骤:
    从项目A 迁移指定js文件到项目B 指定目录分析用例引用的函数、xpath,需要和存量函数做匹配,匹配失败则需要迁移函数、xpath分析用例中的 namespace、路径引用是否正确,若不一致需要改造

结果:代码迁移的工作比较繁琐,需要仔细检查依赖、路径引用、迁移对应缺失的函数、xpath,但本身无业务逻辑。理论上是非常适合让 AI 处理。




2.2.2  辅助Hades文档重构

背景:Hades 框架集成了APIDoc能力,发包后会生成一份静态 API 文档资源。文档内容的来源就是代码中函数注释。历史原因,函数的注释都不太标准,缺少很多示例,所以导致 API 文档也饱受吐槽,很多新人看不懂入参。

w19.jpg

实现:重构的工作仅仅是改造函数注释,内容简单,但是工作量大,要求细致。也是非常适合 AI 处理,采用 Cursor 的 composer 能力,用两种不同的模式实践。

    normal 模式。重构了7个ts 文件,约 90个函数注释。总计分7次,生成用时不到20分钟,但花费了约 1.5h~2h 校对、排查AI代码的 bug、重新生成。

    agent 模式。重构了12个ts文件,约70个函数注释。总计分三次,生成耗时低于10分钟,校对约20分钟。

结果:总耗时约 2.5 小时( 如果全程用 agent 模式,应该在 1 小时以内)。人工约8小时的工作量,压缩到2小时左右。




2.2.3  Agent结合 MCP 写自动化脚本的验证
背景:之前实现了AI辅助生成代码能力,核心原理是利用知识库、上下文,让AI把注释翻译成对应的函数调用代码。准确度比较可观,但是缺点也明显:需要编写的注释内容尽量贴合函数的描述,并且每个步骤都需要编写注释。

思路:


    规范化自动化编写流程:按照一个新人写自动化的思路,把核心的自动化背景知识、项目结构、自动化流程与规范梳理出来,让 Agent 按照该流程收集信息。比如:先分析当前用例所属模块、收集同模块其它用例脚本、收集该模块对应的函数、测试数据,综合这些信息再去编写代码。

    MCP 能力封装:目前FastQA平台上收录了比较全的自动化API,可以封装成 mcp 工具,让 AI 自主调用。

    Agent 任务自动触发:市面上已有比较成熟的 Agent 插件,但是每次都手动输入一大段 prompt 显然不现实。调研发现有些 Agent 插件注册了全局命令,可以供其它插件调用。所以可以尝试Hades插件去收集数据,构造 prompt,然后触发 Agent 插件任务。进一步降低使用成本。

w20.jpg

结果:
    尝试了订单、检测两个场景,多数情况能有60%~90%的准确率,但是不稳定。每次agent的思考过程都有差异,从而导致结果都不一样。 准确度也取决于用例的描述。给出描述越多、越细致,生成的越准。如果描述很粗,生成的代码比较随机单个case生成大概1.5 min~3min。属于 Agent 的正常速度。但也有例外,AI 把代码格式修改错误,然后反复调整、修正,导致时间很长。



2.3 【接口测试自动生成】

编码场景:接口自动化测试代码类

编码案例:


    解决老接口逻辑模糊:缺乏文档,功能不透明,人工梳理代码效率极低;

    解决新接口用例覆盖不足:难以快速理解设计逻辑,导致测试用例遗漏风险。

w21.jpg

提效效果

    通过Cursor 智能代码分析工具,可自动:

    解析接口逻辑 ------快速生成功能说明,替代人工逐行阅读代码;
    辅助用例设计 ------明确输入输出和业务规则,快速生成接口自动化用例;⏱ 效率提升 50%+ ,让测试工作从"盲目摸索"转向"精准出击"。


三、AI专项能力落地--助力质量效率提升优化

我们H1组织多个人员针对一些高优领域,进行AI的重点提效建设

3.1【自动化测试编码提效--AI 辅助生成 UI自动化代码】

工具原理:利用 vscode 插件能力 + AI 知识库,让 AI 根据用例步骤描述生成对应的自动化代码。也支持对缺失的包自动导包。

w22.jpg

工具进展 :目前对接了4 个自动化代码库:定制工具、内参、云图、coohom

w23.jpg

存在的问题:有很多组用例规范性不足,不满足对接条件。

工具使用情况:经实际验证,定制、云图业务生成的代码准确率在 50~100%之间

w24.jpg

3.2 【多语言错误检测-- AI助力国际化多语言异常检测】

目标:国际化翻译准确的 AI 识别,希望把 coohom 这边常用的网页设计规范让 AI 能够识别出,包括文本规范性、页面布局等等

思路:利用AI知识库能力,预设正确错误国际化翻译及布局情况,通过AI动态检测当前版本多语言情况,

进展:常态化运行中,与pub、引导配置平台、网页插件、vscode 插件进行了打通,实现多端互通。

w25.jpg
PUB 平台引导配置网页插件:UI 自动化

w26.jpg

w27.jpg

w28.jpg

w29.jpg

3.3【自动化测试bug/issue准确度提升-- AI助力自动化错误分析】

3.3.1【UI自动化报告AI分析】,累计分析287次

    优化并引入了调用链,控制台日志等,目前已经接入自动化issue


w30.jpg


    Allure 报告插件接入 ---Allure 报告对接Apollo AI分析能力

    w31.jpg




3.3.2【接口自动化失败AI分析】,累计分析173次

结合调用链、断言、响应体、状态码等信息,支持对接口自动化case、巡检case的结果进行AI辅助分析

w32.jpg

四、MCP Server及应用搭建辅助提效

通过内部统一平台聚合测试效能,简化MCP Server接入成本。为此我们搭建了许多MCP应用。


4.1 【CF MCP Server】

能力介绍:

基于fastapi-mcp实现CF文档的读取、分析与搜索功能。

实现:

    需要将cf上的内容存入到fastGPT中

    拉取CF内容并转换为markdown格式(Python版)

    使用fastapi-mcp编写一个sse类型的mcp


典型应用场景/提效:

    自动补全或分析CF文档内容

    构建CF文档知识库,支持智能搜索

4.2 【Tools MCP Server】

能力介绍:

提供负责人查询、调用链分析和日志分析能力。

典型应用场景/提效:

    环境稳定性群中快速解答环境问题

    一键查询服务/接口负责人信息

4.3 【Kaptain MCP Server】

能力介绍:

敏捷组信息获取与智能分析能力。

典型应用场景/提效:

    快速查询敏捷组信息

    智能关联相似工单补充测试用例

    自动执行测试步骤并记录结果

    一键生成故障分析报告

4.4 【Hades MCP Server】

能力介绍:

提供Hades框架API信息查询能力。

典型应用场景/提效:

    构建API知识库,支持AI自主搜索

    快速获取框架API使用方式

4.5 【Apollo UI MCP Server】

能力介绍:

测试计划信息查询与任务执行功能。

典型应用场景/提效:

    接入企信群实现自动化报告收集

    支持测试计划执行与重跑操作

4.6 【Kuta MCP Server】

能力介绍:

提升业务线工单排查自助能力。

思路:

Kuda平台有非常多的工具,直接将工具列表相关的信息作为一个接口的注释暴露给AI,让AI自己从工具列表中找要调用的方法和构造入参。

典型应用场景/提效:

    根据输入自动匹配调用kuta工具

    快速定位工单问题

4.7 【订单MCP Server】

能力介绍:

FastQA Workflow MCP接入能力。

思路:

    kuta上面已经有一些现有的各种查询工具,我们可以基于此进行mcp server的开发核心工具注册typescript,只需要对应的工具id,以及对应工具需要的参数,即可注册

    每个查询工具返回的数据结构不一样,可以直接在cursor的聊天窗口中,让他针对这些数据进行格式化输出和美化调整

典型应用场景/提效:

    根据订单编号智能查询相关信息

    快速构建业务知识库



4.8【商业平台MCP Server service】

MCP Server范畴及使用量


    /cf-mcp:CF操作

    /tools-mcp:服务信息查询、调用链分析、日志分析

    /arc-mcp:权限权益操作

    /arc-acs-mcp:用户信息查询

    /arc-measurement-mcp:核豆流水数据查询

    /py-mcp:输入python代码获取执行结果

w33.jpg

4.9 【质量效能MCP Server service】MCP Server范畴及使用量


    /mcp-kuta/{业务线名称}:各业务线kuta工具调用

    /mcp-apollo:apollo信息查询

    /mcp-hades:hades自动化框架API信息查询

    /mcp-fastqa-workflow:fastqa平台工作流接口调用

    /mcp-kp:kaptain信息查询

w34.jpg

五、质量效能AI平台使用数据

对于完整的任务工作流,从需求评审、开发设计、测试、发布上线与工单处理,每个阶段质量效能团队均在搭建AI工具介入场景。下图所示为相关AI工具在各个阶段的工作场景:

w35.jpg

当前AI探索与应用在团队内如火如荼的展开,搭建了大量的AI工具,并不断赋能运营、商务、产研同学。下图为当前AI测试平台的使用情况,另各个业务线独立AI工具单独统计,不再单独展示:
w36.jpg




六、小结

本文内容是我们团队进行了明确的专项和规划后所取得的一些进展,欢迎有类似述求的团队沟通讨论。随着AI的持续发展,我们已然看到了它对于互联网及软件工程领域带来的巨大价值,测试领域也是受用方之一。

AI是一个万花筒,对于我们测试同学来说不仅要持续学习AI、掌握AI,更要结合我们实际业务场景和诉求,合理利用AI能力,与我们现有的系统、流程做深度结合,才能发挥它最大的价值。

推荐阅读
    AI驱动的工单系统能力全景解析:助力企业智能升级"失控的开关":技术债务治理的破局之道错过这篇"技术支持AI知识库搭建",你可能后悔整个 2025 年!JSON 断言器,让测试自动化效能狂飙
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-8-18 17:39 , Processed in 0.217780 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表