弱AI vs 强AI:拖拉机与法拉利的差距
看一眼最新的 LMArena 榜单(2026年1月数据):
Coding 能力 Top 5:
1. Claude Opus 4.5 (thinking-32k) - 1542分2. Claude Opus 4.5 - 1524分3. Gemini 3 Pro (grounding) - 1519分4. Claude Opus 4.5 (thinking) - 1516分5. Claude Sonnet 4.5 (thinking) - 1514分
综合能力 Top 5:
1. GPT-5.2 (search)2. Gemini 3 Pro (grounding)3. GPT-5.1 (search)4. Claude Opus 4.5 (thinking-32k)5. Claude Opus 4.5