Groq 现已向其客户交付硬件
由前 Google 员工创立的 AI 芯片初创公司 Groq 今日表示,该公司目前正在将其硬件交付给客户。这其中包括 Groq Node,这是一个 5U 数据中心级机箱,旨在处理机器学习工作负载,消耗 3.3kW 的功率并提供多达 6 个 POPS。每秒六次 Peta 运算,或更具体地说,每秒六次四千万次 INT8 计算。每个节点包含八个 Groq PCIe 卡,并且可以使用 200G 以太网或 Infiniband HDR 通过各种拓扑将节点互连。内部集成了两个 AMD 第二代 Epyc 处理器。据了解,每张卡均具有 Groq 的定制 AI 加速器芯片,据称,该芯片可以使用 ResNet-50 v2(批处理大小为 1)每秒执行 18,900 次推理。这家初创公司认为其硅片-称为 Tensor 流处理器或 TSP-是「最快的商用 AI / ML 加速器,其响应速度以百分之一毫秒为单位进行测量」,击败了 Nvidia。(The Register)