马斯克宣布Grok4发布超越人类推理能力

访客 2025-07-10 14:35:41 61806

默认

马斯克宣布旗下公司研发的Grok4产品正式发布，该产品具备超越人类推理能力的智能水平，Grok4通过先进的算法和庞大的数据处理能力，能够在短时间内处理大量信息并做出精准决策，为各个领域带来革命性的突破，这一创新技术的问世将极大地推动人工智能领域的发展，并有望为人类生活带来更多便利和可能性。

马斯克宣布Grok4发布超越人类推理能力！xAI终于发布了下一代大模型Grok 4，其能力超乎想象。北京时间今天中午12点左右，马斯克在直播中表示这是世界上最好的AI，并展示了其强大功能。

Grok 4无需事先查看题目就能在SAT考试中获得满分，GRE任何学科也能接近满分，超过了所有研究生的水平。马斯克认为Grok 4可以实现科学新发现。由于计算能力和强化学习的提升，Grok 4的推理能力比前代提升了10倍。从Grok 2到Grok 4的技术范式不断升级，包括下一个token预测、预训练计算、预训练+RL和RL计算。

Grok 4还增强了调用工具的能力，在各类高难度Benchmark上表现远超SOTA。在HLE（人类最后的考试）中，Grok 4使用工具后的成绩为38.6%，而Grok 4 Heavy的成绩达到了44.4%。如果让大模型花费更多时间思考并适当使用外部工具，HLE分数能进一步提升到50.7%。此外，在GPQA、AIME25、LCB、HMMT25和USAMO25等基准测试中，Grok 4 Heavy均取得了最新SOTA。

Grok 4已经实现了博士后水平，在所有学科都能表现出色。马斯克多次强调，Grok将在今年内实现新的科学技术发现。根据Artificial Analysis的评估，Grok 4总成绩达到了73分，领先于o3、Gemini 2.5 Pro、Claude 4 Opus和DeepSeek R1 0528。

Grok 4不仅在语言基准测试中表现出色，还在语音能力、角色多样性等方面得到了加强。语音速度快了2倍，支持5种语音，单日用户总停留时长提升了10倍。新增的角色Eve和Sal已在iOS版Grok中可用，其中Sal支持多种性格，Eve可以唱歌和低语。

在ARC-AGI基准测试中，Grok 4取得了最新SOTA，特别是在ARC-AGI-2上达到15.9%。在Vending-Bench基准测试中，Grok 4也超越了其他模型，显示了其在真实物理世界中执行复杂操作任务的能力。

Grok 4可通过API调用，提供256K tokens的上下文窗口，现已开放使用。DannyLimanseta用Grok 4在4小时内制作了一款FPS射击游戏，效果非常不错。接下来，xAI还将发布代码模型、多模态智能体以及视频生成模型。目前，Grok 4已经上线，但需要付费使用，价格较为昂贵。年付SuperGrok为300美元，SuperGrok Heavy则为每年3000美元。