导航菜单

Claude

浏览所有标有Claude的文章

4 篇文章

Claude Opus 4.8 评测 2026:SWE-bench 69.2%、诚实性升级、定价与升级决策指南

Claude Opus 4.8 以诚实性和长程 agent 能力为核心升级,SWE-bench Pro 69.2%、漏报代码缺陷率仅 3.7%,定价与 4.7 持平,编码与专业分析场景首选,但高 effort 档位默认会让额度消耗超预期。

AI产品评测
62 分钟阅读2026年6月15日

Claude Fable 5 全面解读:Anthropic 旗舰模型能力、定价与 API 接入完整指南

Anthropic 的 Mythos 级模型 Fable 5 终于对外开放——SWE-Bench Pro 得分 80.3%,Stripe 用它一天完成团队两个月的代码迁移。任务越复杂,它比 Opus 4.8 的领先幅度越大;定价、接入、安全降级机制一文说清。

AI产品评测
37 分钟阅读2026年6月12日
Claude Opus 4.5 vs Gemini 3 Pro 对比分析

Claude Opus 4.5 vs Gemini 3 Pro 对比分析

CTO必读:Claude Opus 4.5 80.9%性能vs Gemini 3低60%成本。企业级多模型混合架构与系统化AI决策框架。

AI产品对比
18 分钟阅读2025年12月1日
Claude Opus 4.5全面评测

Claude Opus 4.5全面评测

Claude Opus 4.5值得使用吗?经过我们为期3天、5个真实场景、30+项benchmark的全面评测,答案是:值得,9.2/10分。

AI产品评测
18 分钟阅读2025年11月25日