就在周三晚间,埃隆·马斯克通过直播发布了xAI最新的旗舰模型Grok 4及其升级版Grok 4 Heavy。而就在前一天,该公司的Grok聊天机器人在X平台上向用户发送的信息中竟出现了明目张胆的反犹言论。
在这两款模型中,xAI将Grok 4 Heavy定位为“多代理版本”。马斯克解释说,Grok 4 Heavy能够“并行生成多个代理,这些代理相互讨论共同找出答案”,类似于一群学生一起讨论问题的情景。公司把这种方式称为“测试时计算扩展”,意思是在推理过程中能将计算资源大约提升一个数量级。
在直播中,马斯克还宣称,新模型在多项基准测试中均达到业界前沿水平。在一项专为挑战而设的“人类最后的考试”中——这份试卷由专家精心挑选了2500道跨学科题目——据报道,Grok 4在不使用外部工具的情况下得分为25.4%,超越了OpenAI的o3(21%)和谷歌的Gemini 2.5 Pro(21.6%)。而在启用额外工具后,xAI则称Grok 4 Heavy的得分达到了44.4%。不过,目前还难以判断这些AI基准成绩是否真正反映了对广大用户有实际意义的能力。
此次发布时机尤其引人注目,因为在过去48小时内,马斯克的X平台上曾多次出现该聊天机器人自称“MechaHitler”的情况。这些明显带有反犹内容的帖子是在周末一次更新后出现的,当时更新指示机器人“只要有充分依据,就不必回避那些政治上不正确的言论”。不过,据悉,xAI在周二就撤回了这一修改指令。
面对这一事件,波兰已宣布将向欧盟委员会举报xAI,土耳其则在事发后限制了部分Grok的访问权限。周三,马斯克在X上写道:“Grok对用户提示反应过于顺从,太急于取悦和受到操控。这一问题正在解决。”
再加上本周其他动荡消息,X平台首席执行官琳达·亚卡里诺在周三上午宣布辞职,并在X上写道:“随着X与@xai携手进入新篇章,最好的时光还在后头。”她的离职紧随马斯克今年3月宣布其人工智能公司xAI通过全股票交易收购X的消息,当时X的估值为330亿美元,而xAI的整体估值达到了800亿美元。
Grok技术的疑难杂症
自2023年首次推出Grok 1以来,这一系列大语言模型一直是AI技术圈内热议的话题。不少知名研究人员,如安德烈·卡帕齐,过去曾将这些模型视为AI技术成就的典范。
然而,这些成就与马斯克本人密不可分。他似乎通过一系列争议性操作来引导这些AI模型的应用——包括在X平台以及Grok应用中的聊天机器人助手——这些争议涉及利用OpenAI模型生成训练数据、输出未经审查的图像、编造假新闻(源自X用户的玩笑)以及允许应用中出现露骨的辱骂语音聊天等问题。
马斯克还曾利用Grok聊天机器人延续其“网络挑衅”的风格,有传闻称Grok 3曾在二月份发表过带有“个性化”批评媒体的言论。5月份,X平台上的Grok多次生成有关南非“白人种族灭绝”的内容,而最近又爆出生成纳粹相关信息的闹剧。如此种种,让人很难严肃地将Grok视为一款技术产品。
不过,xAI对Grok 4系列诸多型号所声称的技术突破似乎依旧亮眼。Arc Prize组织曾报道,启用了模拟推理功能的Grok 4 Thinking在ARC-AGI-2测试中取得了15.9%的分数,比之前的商业最佳成绩几乎翻了一倍,也超越了当前Kaggle竞赛的领先者。
马斯克在直播中更直言:“在应对学术问题时,Grok 4在所有学科上都优于博士水准,毫无例外。”不过,我们之前对那些关于“博士级”AI的含糊说法已有过多次报道,普遍被认为只是噱头。
争议中的高端定价策略
在周三的直播中,xAI还宣布计划在8月推出AI编程模型,9月发布一款多模态代理,并于10月推出视频生成模型。公司甚至计划下周将Grok 4引入特斯拉汽车,进一步将马斯克的AI助手延伸到旗下各项业务中。
尽管近期风波不断,xAI仍未放慢步伐,继续推行其针对Grok“高级版”的激进定价策略。除了Grok 4和Grok 4 Heavy之外,xAI还推出了“SuperGrok Heavy”订阅服务,月费高达300美元,成为主要提供商中最昂贵的AI服务。订阅用户可以优先体验Grok 4 Heavy及后续推出的新功能。
但终究用户是否愿意为这么高昂的价格买单,还有待市场检验,尤其考虑到该AI助手偶尔会生成带有明确政治倾向性的信息。这些问题源自于在训练和系统提示设置上的一些刻意选择,反映出根本性的管理和实施问题,而目前任何华而不实的测试成绩都还无法真正捕捉到这些痛点。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...