中国电子展解析国产GPGPU的进阶之路2021年一月,上海天数智芯半导体有限公司(以下简称:天数智芯)宣布,公司旗舰7nm工艺GPGPU云端训练芯片BI成功点亮,这是国内全自研、线nm工艺GPGPU训练芯片。中国电子展专注于全面展示电子产品设计生产所需的各类电子元器件及物料产品,这篇文章中国电子展小编为大家分析国产GPGPU的进阶之路。
紧接着,2021年3月31日,天数智芯正式对外发布全自研高性能云端7nm芯片BI及产品卡,实现国产云端高性能GPGPU芯片从0到1的突破。在算力方面Kaiyun,天数智芯BI产品单芯每秒可进行147万亿次FP16计算(147TFLOPS@FP16)。
天数智芯在BI产品“点亮”时提到,BI产品的理论峰值性能达市场主流产品的2倍。一时间,国产GPGPU似乎已经站在世界之巅。
软件的重要性是毋庸置疑的,是发挥GPGPU硬件潜力的必要一环,让抽象的算力资源能够和具体应用深度结合。目前,在GPGPU领域,无论是CUDA/OpenCL/TensorRT这些硬件加速平台,还是TensorFlow/PyTorch等主流深度学习开发框架,主导者都是国际厂商或机构。
国内企业一定要敢于承认这种差距,在解决这些问题以后,国内的运算平台才会有真正的用武之地。我们企业还是要围绕怎么解决用户需求去发展,在这个过程中不断追赶并缩小这种差距。
在天数智芯BI产品的介绍中我们看到,这款全自研通用计算GPGPU芯片聚焦于云端训练市场。长期以来,云端训练市场被国际巨头垄断,不仅加速卡产品成本高,且生态较为封闭,制约了AI产品多元化发展和升级迭代。
BI产品是国内全自研、真正基于通用GPU架构的GPGPU云端高端训练芯片,以比同类产品更小的芯片面积 、更低的功耗,提供主流厂商实测接近的性能。总结而言,BI产品有以下几个优势:
作为一种通用计算芯片,云端训练只是GPGPU典型的应用场景之一,正如NVIDIA所言,GPGPU的目的是将AI引入到各行各业中。
GPU在端到端AI部署中,属于一个已经被验证的芯片架构。AI端侧发展会驱动应用背后更多新型函数和新型算子的出现,这些需求将被融合到GPU未来的软硬件开发中。
GPGPU的设计特点在于其通用可编程性,对于层出不穷的新的算法和应用,能做到性能和开发成本间较好的平衡。同时,基于GPGPU的通用性,客户可以在类似软硬件架构间的产品间进行应用的无痛迁移。
在GPGPU领域,NVIDIA无疑是行业的标杆,不仅拥有百万开发者支持的CUDA,还在指令集的覆盖面、颗粒度、效率等维度有领先优势,再考虑到产业生态,国产GPGPU替代还有很长的路要走。在NVIDIA官网有提到,AI应用不仅需要大的内存池,也需要CPU和GPU紧密耦合。
GPU注重的是同类型的数据按照同样的处理流程进行高效并行处理,CPU的优势是处理复杂逻辑流程。CPU和GPU在一个芯片上是可以实现的,而且以前也存在这种整合性的产品,但是对于高端的、云端的CPU加上GPU同时实现,需要非常大的尺寸规模,而且会限制芯片在各自领域的性价比。
艾瑞咨询此前在相关报告中指出,2020年中国人工智能基础层市场规模为497亿元,为AI产业总规模的33%,AI芯片的高增长是产业规模增长的主要推动力。未来,算力模块的智能服务器国产化率将逐步提升。
毫无疑问,云端训练在未来很长一段时间内仍将是AI芯片的主要市场,市场占比会一直处于前列。随着AI、5G技术的持续发展与应用落地,端侧及边缘侧未来对算力性能的要求会越来越大。其中,数据中心以及金融、电信等方面将会是很大的市场。
更多信息请关注深圳电子元器件及物料采购展览会,今年展会将与NEPCON 亚洲电子生产设备暨微电子工业展览会、S-FACTORY EXPO 智能工厂及自动化技术展览会、汽车电子技术展览会 同期举办。通过展示电子元器件及物料+电子生产制造设备+智能工厂及自动化设备+汽车电子技术等一体化电子制造产业链产品及技术方案,服务全体“电子人”一站式采购平台。2021年10月20-22日在深圳国际会展中心(宝安新馆)举办,期待您的到来。
Copyright © 2021-2025 开云(中国)Kaiyun·官方网站 - 登录入口 版权所有 非商用版本苏ICP备2021025391号-1 Xml网站地图 HTML地图 txt地图