
发布于
2025 年 9 月 9 日
Sonoma Alpha Sky & Dusk 模型:在 Cline 中的真实世界表现
本周,两个神秘的 AI 模型出现在 Vercel AI Gateway 和 OpenRouter 上:Sonoma Sky Alpha 和 Sonoma Dusk Alpha。凭借 200 万令牌的上下文窗口和免费的 alpha 访问权限,它们在 AI 社区引起了广泛关注。
我们一直在 Cline 中追踪它们在数千个真实编码任务中的表现。以下是数据显示的结果。
模型
Sky - 定位为能力更强的推理模型
Dusk - 设计用于更快推理的模型
在分析了过去两周在 Cline 中进行的数千次差异编辑操作后
- Claude 4 Sonnet: 96% 成功率
- GPT-5: 92% 成功率
- Gemini 2.5 Pro: 90% 成功率
- Dusk: 87% 成功率
- Sky: 84% 成功率

这意味着什么
200 万的上下文窗口在纸面上令人印象深刻,但对于生产编码工作来说,可靠性更重要。虽然 Sonoma 模型都非常快,但与成熟模型相比,它们的准确性较差。
我们的 Discord 社区报告了不同的体验——一些用户欣赏它的速度,而另一些用户则遇到了幻觉和工具调用问题。
如何试用 Sky 和 Dusk
在 alpha 阶段,这两个模型都可以通过 Vercel AI Gateway 和 OpenRouter 免费使用。
鉴于性能差距,我们建议在尝试 Sonoma 模型处理非关键任务时,仍将 Claude 或其他可靠模型作为您的主要选择。

这对您意味着什么?
Sonoma Alpha 模型代表了 AI 模型部署方面的一次有趣尝试——神秘的来源、令人印象深刻的规格、免费访问。但在实际编码工作方面,成熟模型在可靠性上仍处于领先地位。
2M 上下文窗口为未来的应用提供了希望,但目前的性能表明这些模型在投入生产使用之前还需要进一步开发。
数据基于 2025 年 8 月 26 日至 9 月 9 日的 Cline 使用情况。Sonoma 模型于 9 月 6 日出现。性能可能因任务复杂性和使用场景而异。


