埃隆·马斯克近日在社交平台X上确认,旗下人工智能公司xAI的内部第 9 版Grok大模型基础模型已正式完成训练。这款新模型拥有高达1. 5 万亿的惊人参数量,预计将在未来 3 到 4 周内向公众发布。
马斯克对这次更新表现出极强的信心,直言新版本将为用户带来“王炸”级别的体验。随着OpenAI和Anthropic在编程领域持续发力,xAI此举意在通过超大规模参数实现技术反超。
正视现有数据缺陷,海量吸纳代码数据
马斯克在前两天坦诚承认,目前投入使用的Grok 4. 3 大模型在实际表现中确实存在数据缺陷。尤其是在AI编程领域,Grok 4.X系列此前的多次更新虽然跑分抢眼,但实际体验仍无法与行业标杆Claude相媲美。
为了彻底填补这一技术短板,新版大模型在正式发布前将进入关键的补充训练阶段。这一阶段将专门用于海量吸纳编程工具Cursor的代码数据,为模型灌输扎实的底层知识。
深度联手Cursor,微调打磨编程能力
在完成底层的代码知识灌输后,研发团队还将通过监督微调(SFT)和强化学习(RL)对模型进行精细化打磨。此前,xAI已经与知名编程工具Cursor达成了深度合作,不仅向对方开放了算力支持,甚至传出可能以 200 亿美元进行收购的消息。
这次互补型的合作,将为新版Grok大模型提供急需的专业编程养分。xAI试图通过这种强强联合的方式,在软件开发自动化领域甩出真正的王牌。