本文作者:访客

马斯克宣布Grok4发布 超越人类推理能力

访客 2025-07-10 14:35:41 61806
马斯克宣布旗下公司研发的Grok4产品正式发布,该产品具备超越人类推理能力的智能水平,Grok4通过先进的算法和庞大的数据处理能力,能够在短时间内处理大量信息并做出精准决策,为各个领域带来革命性的突破,这一创新技术的问世将极大地推动人工智能领域的发展,并有望为人类生活带来更多便利和可能性。

马斯克宣布Grok4发布 超越人类推理能力!xAI终于发布了下一代大模型Grok 4,其能力超乎想象。北京时间今天中午12点左右,马斯克在直播中表示这是世界上最好的AI,并展示了其强大功能。

马斯克宣布Grok4发布 超越人类推理能力

Grok 4无需事先查看题目就能在SAT考试中获得满分,GRE任何学科也能接近满分,超过了所有研究生的水平。马斯克认为Grok 4可以实现科学新发现。由于计算能力和强化学习的提升,Grok 4的推理能力比前代提升了10倍。从Grok 2到Grok 4的技术范式不断升级,包括下一个token预测、预训练计算、预训练+RL和RL计算。

马斯克宣布Grok4发布 超越人类推理能力

Grok 4还增强了调用工具的能力,在各类高难度Benchmark上表现远超SOTA。在HLE(人类最后的考试)中,Grok 4使用工具后的成绩为38.6%,而Grok 4 Heavy的成绩达到了44.4%。如果让大模型花费更多时间思考并适当使用外部工具,HLE分数能进一步提升到50.7%。此外,在GPQA、AIME25、LCB、HMMT25和USAMO25等基准测试中,Grok 4 Heavy均取得了最新SOTA。

马斯克宣布Grok4发布 超越人类推理能力

Grok 4已经实现了博士后水平,在所有学科都能表现出色。马斯克多次强调,Grok将在今年内实现新的科学技术发现。根据Artificial Analysis的评估,Grok 4总成绩达到了73分,领先于o3、Gemini 2.5 Pro、Claude 4 Opus和DeepSeek R1 0528。

马斯克宣布Grok4发布 超越人类推理能力

Grok 4不仅在语言基准测试中表现出色,还在语音能力、角色多样性等方面得到了加强。语音速度快了2倍,支持5种语音,单日用户总停留时长提升了10倍。新增的角色Eve和Sal已在iOS版Grok中可用,其中Sal支持多种性格,Eve可以唱歌和低语。

马斯克宣布Grok4发布 超越人类推理能力

在ARC-AGI基准测试中,Grok 4取得了最新SOTA,特别是在ARC-AGI-2上达到15.9%。在Vending-Bench基准测试中,Grok 4也超越了其他模型,显示了其在真实物理世界中执行复杂操作任务的能力。

马斯克宣布Grok4发布 超越人类推理能力

Grok 4可通过API调用,提供256K tokens的上下文窗口,现已开放使用。DannyLimanseta用Grok 4在4小时内制作了一款FPS射击游戏,效果非常不错。接下来,xAI还将发布代码模型、多模态智能体以及视频生成模型。目前,Grok 4已经上线,但需要付费使用,价格较为昂贵。年付SuperGrok为300美元,SuperGrok Heavy则为每年3000美元。

马斯克宣布Grok4发布 超越人类推理能力

马斯克宣布Grok4发布 超越人类推理能力

阅读
分享