随着人工智能技术的迅速发展,全球高科技产业的竞争愈演愈烈,尤其是在AI运算和超算领域。日前,日本宣布将推出一款新的Z级AI超算FugakuNEXT,计划在2030年问世,并表示其性能将是当前的100倍,这一切都得益于NVIDIA未来一代GPU的支持。考虑到AI技术的战略重要性,日本并不想在这一领域落后于其他国家,正积极推动自主芯片的研发。
自主研发的必要性
尽管日本能够使用NVIDIA的先进GPU进行AI计算,但依赖第三方公司必然存在“卡脖子”的风险。随着国际市场竞争的加剧,技术壁垒和供应链的不确定性让日本认识到,拥有自主研发的芯片技术才是根本解决之道。这不仅是为了增强国家的科技实力,更重要的是在关键技术领域保持独立和安全。
日本着手推动一项名为Pezy的芯片计划。Pezy Computing KK公司在日本NEDO的资助下,承担起了这一重任。该公司的目标是研发出满足高性能计算需求的芯片,以支持FugakuNEXT等下一代超算。
Pezy-SC4芯片的技术规格
在最近于Hotchips 25会议上,Pezy Computing KK公布了其新一代Pezy-SC4芯片的相关信息。Pezy-SC4芯片将采用台积电的5nm工艺,面积达到555.7mm²,拥有48亿个晶体管,配备2048个核心,主频为1.5GHz,并含有64MB L3缓存和96GB HBM3内存,功耗则控制在600W以内。这一系列技术指标使Pezy-SC4在FP64、FP32和FP16等浮点计算方面展现出强大的性能,峰值性能分别达到24.6TFLOPS、49.2TFLOPS和98.4TFLOPS。
未来展望:Pezy-SC5芯片
Pezy Computing KK的研发并不止步于Pezy-SC4,未来还将推出Pezy-SC5系列芯片。该系列芯片将采用更为先进的台积电3nm工艺,面积将进一步增至785mm²,晶体管数量则激增到100亿个,核心组数达到4096组。Pezy-SC5在内存配置上将升级到192GB的HBM3e,功耗为900W。性能方面,据报告显示,该系列芯片在FP8计算中的最大性能将达到329.6TFLOPS,可全面适应当今AI时代的需求。
性能对比:Pezy与NVIDIA GPU
许多人会关心,Pezy-SC4及SC5与NVIDIA的GPU相比究竟如何。在FP64能效方面,Pezy-SC3和SC4的能效分别为41.9和41 gflops/w,而SC5的能效可达45.8 gflops/w。相比之下,NVIDIA的H200在FP64能效上为47.9 gflops/w,而B200则为33.3 gflops/w。虽然NVIDIA的H200在FP64能效上略占优势,但Pezy系列芯片在不同浮点计算格式上的表现则更为全面。例如,Pezy为FP8计算提供了充分支持,彰显出其在多样化计算需求上的灵活性。
日本通过Pezy芯片的研发,不仅展示了其在高性能计算领域的潜力,也为其超算FugakuNEXT的成功提供了坚实的技术支撑。尽管NVIDIA目前在GPU市场上占据霸主地位,但随着Pezy芯片的不断更新迭代,未来或将迎来“更强对手”。这场高科技战争的胜负,将不仅关乎芯片的性能,还关乎国家的科技独立和未来发展。Pezy系列的成功,不仅能够推动日本在AI领域的进步,也将为全球技术生态带来积极影响。随着全球竞争的加剧,各国都在加速技术创新,只有具备强大自主研发能力的国家,才能在这个新兴的AI时代立于不败之地。