要点速览
- Meta 秘密测试 Llama 4 “Behemoth”(巨兽)模型,参数量或突破 8000 亿
- 该模型在数学竞赛和逻辑推理任务中达到“专家级”表现,对标 GPT-5.3
- 美政府新规:联邦承包商禁止使用中国背景 AI 模型(包括 DeepSeek, Qwen)
- Meta 借机巩固其作为“开源 AI 全球基准”的地位,填补市场空白
- 地缘政治正成为 AI 技术演进的“隐形调节器”
新闻摘要
2026 年 2 月初,AI 社区传出了关于 Meta 下一代模型 Llama 4 的最新消息。其中代号为 “Behemoth” 的顶级版本已进入有限研究预览阶段。泄露的基准测试数据显示,Llama 4 Behemoth 在处理复杂的跨学科推理任务时表现惊人,尤其在法学和生物医药研发的模拟测试中,其智能水平被评估为“具有高度专家倾向”。
与此同时,华盛顿发布了一项影响深远的政策更新:从 2026 年起,所有涉及美国联邦政府合同的企业和机构,被禁止在核心生产环境中使用具有中国背景的 AI 模型。这一禁令直接点名了近期在开发者群体中极受欢迎的 DeepSeek 和 Qwen(通义千问)系列。这一政策变动使得原本在开源领域与中国模型展开激烈竞争的 Meta,瞬间获得了某种程度上的“防御性优势”,大量受合规性约束的开发者正被迫回归 Llama 生态。
新闻解读
开源与闭源的终局之战:Meta 坚持开源 Llama 系列的战略正在产生巨大的“引力效应”。如果 Llama 4 Behemoth 真的能达到专家级水平且保持权重开放,那么它将彻底打破 OpenAI 和 Anthropic 对顶级算力的垄断。马克·扎克伯格正试图用开源模型构建一个全球性的“AI 底层操作系统”,让 Meta 成为事实上的标准制定者。
AI 的“国别标签”时代:曾几何时,开源模型被认为是无国界的。但随着美国政府禁令的出台,AI 模型也被贴上了深厚的政治标签。这给全球开发者提出了难题:是选择性能更强的特定模型,还是选择合规性更好的本土模型?这种碎片化的市场格局,可能会导致全球 AI 研究在标准和接口上出现类似当年“冷战”时期的分歧。
推理算力的门槛:“Behemoth” 之所以受关注,是因为它代表了算力消耗的新极限。8000 亿甚至上万亿参数的开源模型,对运行环境的要求极高。这实际上是在变相推动 NVIDIA 和 AMD 的高端卡需求,同时也促使开发者寻求更高效的量化和蒸馏技术。Meta 在提升模型智力的同时,也在变相重塑全球硬件市场的需求结构。
