北京时间7月10日中午12时左右,马斯克旗下xAI公司推出的Grok-4系列模型终于发布。只是开始的比原定计划时间整整晚了一个小时。
直播一开场,马斯克就搬出一句熟悉的台词:“这是世界上*的AI,让我们来展示一下”。只不过最豪迈的发言搭配的发布形式“略显潦草”,有观看直播的网友吐槽,“老马满脸疲惫”。

马斯克特别表示,在学术问题上,Grok 4能在所有学科中达到甚至超越人类博士水平。他还特别自信地预测,Grok 4有望在今年内为人类带来“发现新科学技术”的突破,并可能在明年发现新的物理现象。
根据规划,xAI还将在8月发布编程模型,9月发布多模态智能体,10月发布视频生成模型。
Grok-4到底有多强?比最强更强
在多项严苛的基准测试中,Grok 4都堪称*。在被称为“人类最终考试”的HLI基准中,该模型在未使用工具的情况下解决了25%的问题。
而其多智能体版本Grok 4Heavy,通过并行协作,多一点时间思考,进一步将文本子集问题的解决率提升至超过50%,也是所有模型中首次突破这一数值的。
此外,Grok 4还在包括PhD级别问题集在内的所有推理基准测试中表现出色,甚至在编码基准和数学竞赛中取得了满分,通常比第二名模型有显著*。
xAI方面介绍,本次发布能够实现远超各类SOTA的成绩,本质上是范式和计算量的跃迁。
与Grok 2相比,Grok 4训练量增加了100倍,并且还在持续扩张。特别是在推理和强化学习方面,Grok 4投入了大量计算资源,其RL计算量是其他任何模型的10倍以上。
要知道在AI领域,xAI一直以“豪”著称,拥有包含10万块H100 GPU的“世界超级计算机”。Grok 2在12个月前还只是一个概念,而如今的标准下,Grok 2的模型智能水平已相当于高中生。
目前,Grok 4的订阅费是30美元/月,Grok 4 Heavy的费用为300美元/月,Grok 3维持免费状态。换算下,最贵的Heavy年费直逼2.1万元人民币了。
除了基础模型能量的大幅提升外,xAI还公布了Grok语音模式的大升级,端到端延迟降低一半,并引入了多款更自然、富有情感的新声音,例如具有史诗般低沉声线的Sal和能表达丰富情感的英伦女声Eve。
尽管Grok 4在多模态理解方面仍存在“部分盲点”,但xAI表示,其基础模型的第七个版本(计划在几周内完成训练)将解决这一弱点,未来模型将能够像人类一样“听到和看到世界”。
在Google等已经取得显著突破的视频生成领域,xAI也紧咬不放,称正在推进模型的训练,预计今年将出现首部可观看的AI生成电视节目片段,明年有望出现首部AI电影。
另有用户已经发现,特斯拉最新固件里已经偷偷加上了Grok的全功能版本,就差激活了。未来,xAI还设想Grok与特斯拉Optimus类人形机器人结合,通过与现实物理世界的互动,将能更深层次地验证假设,推动AI能力的最终飞跃。
写在最后
这次发布会还都是老面孔,比如Yuhuai Wu,本次发布会右二,作为xAI的联合创始人,上一次Grok3发布的时候就已经引起国内注目了。
他在2021年博士毕业于多伦多大学机器学习专业,博士期间曾在 Deepmind和 OpenAI实习,同时也在斯坦福做博士后研究。坐在他左边的是他在多伦多大学的老师,也是xAI核心成员吉米·巴。
从创立之初xAI的华人含量就不低,联合创始人Greg Yang,出生于湖南,初中开始前往美国学习,本科和硕士学位都在哈佛大学数学系攻读。杨格的履历十分丰富,与苹果、谷歌、高通、英伟达都曾有过关联。2018年,Greg Yang获得了本科生数学领域的最高荣誉Morgan Prize,之后加入了微软雷蒙德研究院,任高级研究员。
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。