测试显示,Qwen3-Coder 在搭建测试基础设施(如使用 minunit 和 gcov)等本地任务中表现优异,现已被 Claude Code、LM Studio 等多个平台集成,并支持 tool calling 功能。
🪶 Kimi K2:轻量级挑战者登场
另一款开源模型 Kimi K2 已上线 Windsurf,被视为对 Qwen3-Coder 的“性价比挑战”。根据 ForgeCode 的基准测试,Kimi K2 在效率和成本上表现更优。尽管定价机制尚未明确,许多开发者已将 Kimi K2 视为 Claude Code 的可替代品。不过,Anthropic 在 API 成本上仍占优势,特别是大规模任务中的“提示缓存”机制能显著降低推理费用。
Anthropic 的 Claude Code 被誉为“全能开发助手”,官方推荐开发者围绕高阶用户的工作流开发应用,并鼓励在 r/ClaudeAI 上收集灵感。平台还引入了“否,并告诉 Claude 应该怎么做”的按钮,强化了用户反馈机制,形成正向迭代闭环。身边的厉害的工程师很多从Cursor 切换到了 Claude Code。
近期社区对 Claude Code 的评价持续升温,有用户直言它已经成为“万能代理(everything agent)”。
@alexalbert__ 公开表示:“Claude Code is the everything agent.”
@swyx 也指出,Claude Code 已被集成至 PostHog,进一步扩展了其在产品分析与开发场景中的实用性。