要点速览

  • Positron AI 完成 2.3 亿美元 B 轮融资,估值突破 10 亿美元大关
  • ARENA、Jump Trading、a16z 等顶级机构领投,Arm 和卡塔尔投资局参投
  • 下一代 Asimov 芯片预计 2026 年底交付,能效比目标达到 NVIDIA Rubin 的 5 倍
  • 核心突破在于解决“内存瓶颈”,单卡显存高达 2.3TB,远超现有 GPU 架构
  • 公司定位于高能效 AI 推理(Inference)硬件,旨在降低大模型运行成本

新闻摘要

2026 年 2 月初,总部位于内华达州的 AI 硬件初创公司 Positron AI 宣布完成超额认购的 2.3 亿美元 B 轮融资,估值正式突破 10 亿美元,迈入“独角兽”行列。本轮融资由 ARENA Private Wealth 和 Jump Trading 共同领投,芯片巨头 Arm 以及卡塔尔投资局(QIA)也提供了战略支持。

Positron AI 的核心任务是解决当前大模型运行中最昂贵的“推理”环节。CEO Mitesh Agrawal 表示,能源和内存是 AI 大规模部署的两大枷锁。公司正在研发的 Asimov 芯片计划在 2026 年底流片(Tape-out),其核心设计思路是以内存为中心。相比于 NVIDIA 即将推出的旗舰 Rubin GPU,Asimov 承诺在核心工作负载下提供 5 倍的能效比(tokens/watt),并且每张卡的显存容量高达 2304GB,是后者的 6 倍之多。

新闻解读

从“训练”转向“推理”:如果说 2024 年是 NVIDIA H100 训练卡的天下,那么 2026 年的竞争焦点已经全面转向了推理。随着 AI 智能体和实时交互应用的普及,如何在有限的功耗和成本下运行这些模型成为了企业的生死命题。Positron 的入场,直接挑战了 NVIDIA 在硬件底座上的统治地位。

内存即王道:大模型的速度往往不取决于算力(TFLOPS),而取决于数据搬运的速度(内存带宽)。Positron 采用的超大内存架构,能够将整个超大规模模型装入单卡或单机架内存中,从而极大地降低了延迟,特别适合长文本(Long-context)和视频生成等重负载任务。

供应链的底气:与许多纸面上的初创公司不同,Positron 已经开始交付其第一代 Atlas 推理系统。该系统完全在美国本土制造,避开了复杂的全球供应链风险。这种“即战力”加上“远景图”的组合,是其获得资本市场高度认可的关键。

By admin

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注