小程序开发公司 Tenstorrent推出RISC-V架构高性能AI芯片,订价仅999好意思元

app开发

7月20日音尘,由外传芯片架构师Jim Keller引导的AI芯片新创公司Tenstorrent近日通过官网晓喻,推出新一代基于RISC-V架构的高性能AI芯片Wormhole n150,以及基于该芯片的PCIe卡Wormhole n300和面向软件建造东说念主员的 TT-LoudBox 和 TT-QuietBox 使命站。

Tenstorrent 首席施行官 Jim Keller 默示:“将更多家具交到建造东说念主员手中老是有意的。使用咱们的 Wormhole 卡发布建造系统有助于建造东说念主员扩大限制并建造多芯片 AI 软件。除了此次发布以外,咱们很慷慨咱们的第二代 Blackhole 的流片和通电发扬终点顺利。”

据先容,Wormhole n150收受 Tenstorrent 自研的纯真、可推广的Wormhole Tensix 东说念主工智能辩论内核,领有72中枢和 108 MB SRAM,主频为1GHz,开动功率高达 160W,不错提供262 TeraFLOPs (FP8)的算力。单芯片卡配备了 12 GB GDDR6 内存,带宽为 288 GB/s。

需要指出的是,Tenstorrent 的每一个Tensix 东说念主工智能辩论内核里面王人集成了 5 个因循各式数据步伐的基于 RISC-V 架构的微处理器。

Tenstorrent称,与传统 GPU 比拟,Wormhole n150提供超卓的性价比和庸俗的数据精度步伐因循。同期,还不错联网成使命站和办事器的多芯片网格,并由两个开源SDK因循,用于高档(TT-Buda)或初级(TT-Metalium)建造,还包括主动冷却套件。

Wormhole n300 便是由两颗Wormhole n150芯片构成的PCIe加快卡,领有128 个Wormhole Tensix 中枢,主频1GHz,192 MB SRAM,以及板载24 GB GDDR6,频率为 576 GB/s,不错在300W 下提供高达 466 FP8 TFLOPS的算力。软件配套方面与Wormhole n150s一致。

Tenstorrent 还推出了新的使命站,包括 TT-QuietBox和TT-LoudBox。

TT-QuietBox 是一款液冷桌面使命站,是面向开动或测试 AI 模子的建造东说念主员的绝佳照拂决策,或者是为 HPC 移植和建造库的绝佳照拂决策。TT-QuietBox 配备了AMD 的 EPYC 处理器和四张Wormhole n300加快卡,统共有 8 个 Wormhole Tensix 处理器。这些处理器通过纯确凿、基于以太网的网状拓扑集中,该拓扑不错推广以达成 96GB 内存池。这使得TT-QuietBox好像开动多达约800亿个参数的单用户/单模子和多达约200亿个参数的单用户/多用户、多个模子。TT-QuietBox 也由两个开源 SDK 因循,用于高档 (TT-Buda) 或初级 (TT-Metalium) 建造。

TT-LoudBox 主要为但愿开动、测试和建造 AI 模子或移植和建造 HPC 库的建造东说念主员提供超卓的性价比的照拂决策。其配备了英特尔的Xeon处理器,和备四张Wormhole n300加快卡,统共有 8 个 Wormhole Tensix 处理器,这种基于以太网的纯真网状拓扑结构不错推广以达成 96GB 内存池。这使得TT-LoudBox好像开动多达约800亿个参数的单用户/单模子和多达约200亿个参数的单用户/多用户、多个模子。TT-LoudBox 也由两个开源 SDK 因循,用于高档 (TT-Buda) 或初级 (TT-Metalium) 建造。

订价方面,Tenstorrent 的 Wormhole n150 零卖价为 999 好意思元,Wormhole n150零卖价为1,399 好意思元,这个价钱要比市集竞争敌手的家具的低廉得多。TT-LoudBox 使命站零卖价为 6,000 好意思元,而 TT-QuietBox 使命站的零卖价为 15,000 好意思元。

小结:

从上头的先容当中,小程序开发咱们不错看到,天然Tenstorrent的Wormhole n150芯片的算力并不高,与英伟达、AMD、英特尔的AI芯片仍有一定差距。算作对比,英伟达的H100在300W功率时其FP8的性能高达 1,670 TFLOPS(稀疏时为 3,341 TFLOPS),远高于160W功率下的Wormhole n150(262 TeraFLOPs ),也高于300W 功率下的Wormhole n300加快卡的算力(466 FP8 TFLOPS)。

安队第2024079期双色球遗漏分析:(热码:遗漏0-3期,温码遗漏4-9期,冷码遗漏10期及以上)

天然从纸面上看,Wormhole 系列AI芯片及加快卡性能不高,但 Tenstorrent 辩论通过提供巨大的可推广性来使其 AI 家具具有竞争力。这意味着当需要妥洽电源时,多个Wormhole 处理器不错算作一个单位开动,或者它们也不错单独使用,这一切王人是因为使用了以太网互连,这是亦然Jim Keller高度救济的。也便是说,要达到访佛英伟达H100的算力,可能需要4张Wormhole n300加快卡互联就不错办到。

而况,在价钱方面,一张英伟达H100 加快卡的零卖价高达 30,000 好意思元,而Wormhole n150的零卖价仅为 999 好意思元,4张Wormhole n300加快卡的零卖价也惟有不到4000好意思元,仅为H100的约1/8。

Jim Keller此前曾经品评英伟达等公司的东说念主工智能芯片不菲,昭彰Tenstorrent恰是但愿提供更具性价比的照拂决策。

而Wormhole AI芯片之是以好像作念到具备更高的性价比,一个要害原因是因为其并未像英伟达、AMD、英特尔的AI芯片那样配备的大容量的HBM(高带宽内存),这是这些AI芯片要害组件,然而其资本奋斗,而况功耗较高。而Wormhole AI芯片则是与Groq的LPU芯片相通,遴荐收受了高带宽的片上SRAM,天然其容量与常见的AI芯片中动辄几十GB、甚而上百GB容量的HBM差距巨大,但由于其顺利是在集成在片内的,无需将数据从GPU到HBM走动搬运,数据处理速率更快、更高效、功耗也较低,综搭伙本也更低。

Jim Keller以为,全新面孔可让Tenstorrent芯片在部分AI行使规模取代GPU及HBM。此外,Tenstorrent也会尽量进步家具资本效益。不外,Jim Keller也坦言念念要动摇当今限制日益强大的HBM产业,或许需要花上数年本事。他展望,翌日将有更多新兴AI芯片公司干预英伟达当今还无法办事到的AI市集,但不是出现单唯一家十足取代英伟达的企业。

裁剪:芯智讯-浪客剑小程序开发公司



Powered by 小程序开发 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024 云迈科技 版权所有