
即时代码生成来了:Cline x Cerebras
每个开发者都熟悉这种感觉。你正处于心流状态,构建复杂的东西,然后——你等待。模型思考。你看着标记(token)缓慢地流进来。你的思绪开始游荡。当响应到来时,你已经失去了思路。
今天,这种情况改变了。我们正在与 Cerebras 合作,在 Cline 中提供每秒 2,000 个标记的代码生成速度。这比典型提供商快 40 倍。
不再等待。你的想法直接转化为可用的代码。
他们如何做到

Cerebras 没有优化现有硬件——他们构建了不同的硬件。他们的 晶圆级引擎(WSE-3) 是一个完整的硅晶圆,作为一个单一芯片运行。900,000 个人工智能核心。44GB 片上 SRAM。所有模型权重都驻留在芯片上,完全消除了内存瓶颈。
结果是:原始性能使他们独自处于“有吸引力的象限”——最小延迟,最大吞吐量。

这种 Cerebras 集成体现了我们的方法。我们天生就是与模型和提供商无关的,不断评估和集成突破性技术。当某项技术为开发者带来真正的价值时,我们会迅速行动,将其提供给您。
今天,Cerebras 的速度是 2,000 个标记/秒。明天可能还会更快。有了 Cline,您始终处于前沿,而无需改变您的工作流程。
开源浪潮

平庸模型的快速推理毫无意义。这就是为什么我们对 Qwen3 Coder 感到兴奋——它与 Claude Sonnet 竞争,并且在 SWE-bench 上击败 GPT-4.1,同时在 Cerebras 上以 2,000 个标记/秒的速度运行。
这不是一种妥协。它是一个前沿质量的编码模型,恰好是开源权重的。

Qwen3 是一个更大趋势的一部分。开源模型正迅速与闭源模型的质量趋同。Kimi K2 和 GLM-4.5 以 10% 的成本提供了 90% 的性能。
当您将这些优秀的开源模型与像 Cerebras 这样的专业推理配对时,您获得的性能将超过通用基础设施上的闭源模型。这就是我们正在建设的未来。
30 秒内开始使用

- 获取您的 Cerebras API 密钥: https://www.cerebras.ai/blog/introducing-cerebras-code
- 选择您的套餐
- 免费版:64K 上下文,受速率限制
- 专业版 ($50/月):131K 上下文,1K 消息/天
- Max 版 ($200/月):131K 上下文,5K 消息/天
- 在 Cline 的提供商下拉菜单中选择 Cerebras 并选择 qwen-3-coder-480b(如果您没有付费计划,请使用免费版本)。