Web出海网 - 海外创业的资源与指南 | 海外独立建站、推广、流量获取

Claude 4发布：最强AI编程模型+最强AI Agent基建！

Claude 4发布了两个模型：Claude Sonnet 4和Claude Opus 4。Claude Opus 4被称为“世界上最好的编程模型”，在编程评测基准SWE-bench上达到了72.5%的成绩。Claude Sonnet 4相比之前的Sonnet 3.7有了显著提升，在SWE-bench上甚至比Opus 4还略高，达到72.7%。Anthropic这次更新主要在四个方面有重大改进，这四项能力的更新显然都是为了Agent或者编程而做的。Claude 4系列都是混合推理模型，提供两种工作模式。价格相比之前的Claude 3.5模型维持不变。Anthropic还发布了几个重要的周边更新。我用生成app原型的提示词对Claude 4 Sonnet、Claude 3.7 Sonnet、Gemini 2.5 Pro模型做了测试，结果差距明显。我建议选择Claude Sonnet 4作为日常编程选择，Claude Sonnet 4 thinking在解决bug或进行项目规划的时候使用，Claude Opus 4和Claude Opus 4 Thinking在非编程的数学、推理等任务上比Sonnet模型更好，也更贵。

2025-05-23