国产高端GPU芯片企业壁仞科技日前在上海发布了其首款产品BR100,算力创下全球算力纪录,国产GPU企业一举打破了国际巨头的纪录,引起广泛关注。
根据壁仞科技创始人、董事长、CEO张文在发布会上公布的数据,BR100的16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别,互连带宽上也创下国内纪录,还是国内率先采用Chiplet技术、率先采用新一代主机接口PCIe 5.0、率先支持CXL互连协议的通用GPU芯片。
BR100直接把中国的通用GPU芯片带入了“每秒千万亿次计算”新时代,峰值算力达到国际厂商在售旗舰产品3倍以上。
国产GPU企业有此底气,背后的秘密是什么?
这个成绩与壁仞以强大的原创架构结合在芯片设计上采用了Chiplet与2.5D CoWoS先进封装技术,同时兼顾高良率与高性能有重要的关系。
这样的设计让BR100在性能上能够媲美英伟达于2022年发布的4nm芯片 H100.在与后者2020年发布的芯片A100相比时,BR100还能实现三倍的性能提升。
壁仞科技联合创始人、CTO洪洲表示,“完全自主的原创架构、先进的封装技术、超大的芯片规模和丰富的片上缓存让我们有了这样的底气 ”。
据介绍,壁仞科技这个名为“壁立仞”的原创架构以数据流为中心,对数据流进行深度的优化,而通过六大技术特性,比较完整地解决了数据搬移的瓶颈和并行度不足的问题,使得BR100芯片在给定的工艺下实现了性能和能效的跨越式进步。
据介绍,BR100采用了Chiplet设计理念,让芯片总面积可以突破光罩尺寸对单芯片面积的限制,集成更多的算力和通用性逻辑;此外,通过缩小单个计算芯粒的面积,还可以同时提升产能与良率,进而极大地降低硅片的成本,并支持更灵活的产品策略。
通过采用Chiplet的方式还可丰富产品形态,例如壁仞科技此次发布的BR104为单die产品,该款芯片同样基于壁立仞架构,性能约为BR100的一半,同样超越了国际厂商的在售旗舰产品。“Chiplet设计让我们可以通过一次流片,同时得到两种芯片,大大加快了迭代速度,同时覆盖不同层级的市场。”洪洲说。
壁仞科技在BR100的接口上也提供了丰富的支持。如支持PCIe 5.0接口技术与CXL通信协议,使其双向带宽128GB/s;原创BLINK高速GPU互连技术,单卡互连带宽达512GB/s,并支持单节点8卡全互连。
整体而言,BR100具有高算力、高通用性和高能效,“三高”特征,让它破势而出,一面市就直接力压全球领先产品。
(文章来源:大众网)