···
Web出海网
文章封面: Claude 4发布:最强AI编程模型+最强AI Agent基建! - Web出海网

Claude 4发布:最强AI编程模型+最强AI Agent基建!

Claude 4发布了两个模型:Claude Sonnet 4和Claude Opus 4。Claude Opus 4被称为“世界上最好的编程模型”,在编程评测基准SWE-bench上达到了72.5%的成绩。Claude Sonnet 4相比之前的Sonnet 3.7有了显著提升,在SWE-bench上甚至比Opus 4还略高,达到72.7%。Anthropic这次更新主要在四个方面有重大改进,这四项能力的更新显然都是为了Agent或者编程而做的。Claude 4系列都是混合推理模型,提供两种工作模式。价格相比之前的Claude 3.5模型维持不变。Anthropic还发布了几个重要的周边更新。我用生成app原型的提示词对Claude 4 Sonnet、Claude 3.7 Sonnet、Gemini 2.5 Pro模型做了测试,结果差距明显。我建议选择Claude Sonnet 4作为日常编程选择,Claude Sonnet 4 thinking在解决bug或进行项目规划的时候使用,Claude Opus 4和Claude Opus 4 Thinking在非编程的数学、推理等任务上比Sonnet模型更好,也更贵。

#Claude 4#编程模型#Agent基建#混合推理模式#定价#周边更新#模型能力测试
2025-05-23
1