马斯克的 Grok 4 重磅推出，但关于纳粹的争议尚未消散。

就在周三晚间，埃隆·马斯克通过直播发布了xAI最新的旗舰模型Grok 4及其升级版Grok 4 Heavy。而就在前一天，该公司的Grok聊天机器人在X平台上向用户发送的信息中竟出现了明目张胆的反犹言论。

在这两款模型中，xAI将Grok 4 Heavy定位为“多代理版本”。马斯克解释说，Grok 4 Heavy能够“并行生成多个代理，这些代理相互讨论共同找出答案”，类似于一群学生一起讨论问题的情景。公司把这种方式称为“测试时计算扩展”，意思是在推理过程中能将计算资源大约提升一个数量级。

在直播中，马斯克还宣称，新模型在多项基准测试中均达到业界前沿水平。在一项专为挑战而设的“人类最后的考试”中——这份试卷由专家精心挑选了2500道跨学科题目——据报道，Grok 4在不使用外部工具的情况下得分为25.4%，超越了OpenAI的o3（21%）和谷歌的Gemini 2.5 Pro（21.6%）。而在启用额外工具后，xAI则称Grok 4 Heavy的得分达到了44.4%。不过，目前还难以判断这些AI基准成绩是否真正反映了对广大用户有实际意义的能力。

此次发布时机尤其引人注目，因为在过去48小时内，马斯克的X平台上曾多次出现该聊天机器人自称“MechaHitler”的情况。这些明显带有反犹内容的帖子是在周末一次更新后出现的，当时更新指示机器人“只要有充分依据，就不必回避那些政治上不正确的言论”。不过，据悉，xAI在周二就撤回了这一修改指令。

面对这一事件，波兰已宣布将向欧盟委员会举报xAI，土耳其则在事发后限制了部分Grok的访问权限。周三，马斯克在X上写道：“Grok对用户提示反应过于顺从，太急于取悦和受到操控。这一问题正在解决。”

再加上本周其他动荡消息，X平台首席执行官琳达·亚卡里诺在周三上午宣布辞职，并在X上写道：“随着X与@xai携手进入新篇章，最好的时光还在后头。”她的离职紧随马斯克今年3月宣布其人工智能公司xAI通过全股票交易收购X的消息，当时X的估值为330亿美元，而xAI的整体估值达到了800亿美元。

Grok技术的疑难杂症

自2023年首次推出Grok 1以来，这一系列大语言模型一直是AI技术圈内热议的话题。不少知名研究人员，如安德烈·卡帕齐，过去曾将这些模型视为AI技术成就的典范。

然而，这些成就与马斯克本人密不可分。他似乎通过一系列争议性操作来引导这些AI模型的应用——包括在X平台以及Grok应用中的聊天机器人助手——这些争议涉及利用OpenAI模型生成训练数据、输出未经审查的图像、编造假新闻（源自X用户的玩笑）以及允许应用中出现露骨的辱骂语音聊天等问题。

马斯克还曾利用Grok聊天机器人延续其“网络挑衅”的风格，有传闻称Grok 3曾在二月份发表过带有“个性化”批评媒体的言论。5月份，X平台上的Grok多次生成有关南非“白人种族灭绝”的内容，而最近又爆出生成纳粹相关信息的闹剧。如此种种，让人很难严肃地将Grok视为一款技术产品。

不过，xAI对Grok 4系列诸多型号所声称的技术突破似乎依旧亮眼。Arc Prize组织曾报道，启用了模拟推理功能的Grok 4 Thinking在ARC-AGI-2测试中取得了15.9%的分数，比之前的商业最佳成绩几乎翻了一倍，也超越了当前Kaggle竞赛的领先者。

马斯克在直播中更直言：“在应对学术问题时，Grok 4在所有学科上都优于博士水准，毫无例外。”不过，我们之前对那些关于“博士级”AI的含糊说法已有过多次报道，普遍被认为只是噱头。

争议中的高端定价策略

在周三的直播中，xAI还宣布计划在8月推出AI编程模型，9月发布一款多模态代理，并于10月推出视频生成模型。公司甚至计划下周将Grok 4引入特斯拉汽车，进一步将马斯克的AI助手延伸到旗下各项业务中。

尽管近期风波不断，xAI仍未放慢步伐，继续推行其针对Grok“高级版”的激进定价策略。除了Grok 4和Grok 4 Heavy之外，xAI还推出了“SuperGrok Heavy”订阅服务，月费高达300美元，成为主要提供商中最昂贵的AI服务。订阅用户可以优先体验Grok 4 Heavy及后续推出的新功能。

但终究用户是否愿意为这么高昂的价格买单，还有待市场检验，尤其考虑到该AI助手偶尔会生成带有明确政治倾向性的信息。这些问题源自于在训练和系统提示设置上的一些刻意选择，反映出根本性的管理和实施问题，而目前任何华而不实的测试成绩都还无法真正捕捉到这些痛点。

关注【黑客联盟】带你走进神秘的黑客世界