微信

Grok 4.5 开启内测,性能比肩 Claude Opus

ZAKER06-29 22:01

埃隆·马斯克宣布,xAI 旗下聊天 机器人 Grok 4.5 的下一版本已正式进入 SpaceX 和 特斯拉 的内部私有测试阶段。据马斯克透露,初步内部评估显示,该模型的性能已接近甚至在部分维度超越了 Anthropic 的旗舰模型 Claude Opus,不过这一说法尚待独立验证。

  1.5 万亿参数底座与 Cursor 数据加持

  马斯克在社交平台 X 上披露,Grok 4.5 构建于 xAI 全新的 1.5 万亿参数 V9 基础模型之上,并引入 AI 编程平台 Cursor 的数据进行补充训练。他强调,强化学习正在持续优化模型表现,并对开发团队的努力表示肯定。

  针对此前引发的过度解读,马斯克澄清称,V9 基础模型并非在所有方面都大幅领先竞品,而是定位为"与 Opus 同一梯队的坚实主力",未来的性能跃升将依赖于持续的迭代训练。

  相较于去年 12 月发布的、基于 5000 亿参数 V8 旧模型的 Grok 4.3,Grok 4.5 被视为一次重大升级,旨在解决 V8 模型存在的若干根本性局限。

  SpaceX 工程师转战 AI,月度迭代成常态

  为加速研发进程,xAI 正对 软件 基础设施进行全面升级。马斯克透露,来自 SpaceX 星链(Starlink)和星舰(Starship)项目的工程师已将工作重心转移至公司 AI 业务,这一资源倾斜显著提升了模型开发速度。

  马斯克还勾勒了一份激进的发展路线图:"在今年剩余时间里,我们将每月发布一款从头训练的全新 AI 模型。"这一频率远超前代产品的开发周期。若 xAI 能如期执行,将在 OpenAI、Anthropic、谷歌等巨头激烈的竞争中,进一步推高整个行业的技术迭代节奏。

  【星途科讯图文丨欧阳布布首发于 ZAKER 科技,转载请注明出处】