随着大数据和人工智能越来越成为当今社会的标准基础设施,云数据中心的硬件和芯片也在为了满足大数据和人工智能的需求而不断演进。大数据和人工智能的一个重要特点就是需要海量数据,这些数据或者由互联网用户产生,或者由服务器经过分析而产生,而这些海量的数据在为大数据和人工智能提供核心支持的同时,也对数据的存储提出了新的需求。
在传统的存储架构中,这些数据存储在SSD中,而这些SSD则会安装在特定的存储服务器中。当服务器需要数据时,需要首先和存储服务器通信,而存储服务器再去从SSD中把数据读取到内存中,CPU去做一系列底层的任务(如筛选,加解密等),完成数据从SSD的读取或写入到SSD。整个过程中,需要存储服务器CPU处理大量这样的底层任务,从而成为SSD读写的能量瓶颈,同时当需要大规模部署时,存储服务器中的CPU也成为了成本中的一个重要部分。
为了解决这样的存储效率问题,计算存储是一个重要的方向。使用计算存储后,SSD硬件中将会通过集成计算和处理芯片来变得智能化,从而将大量重复的底层任务直接交给这些SSD集成的计算和处理芯片来完成,从而降低了对于存储服务器中CPU的需求——存储服务器中的CPU可以用来处理一些更加高层任务。在智能化SSD中,许多底层任务并不需要特别高端的CPU,因此通过集成较为基础的CPU在SSD中可以降低存储服务器中CPU的运算量;同时智能SSD中的许多底层任务甚至可以用固化的数字逻辑来实现,这样来说就可以进一步增加运算和处理的效率,因为CPU对于这类专门任务的处理效率,尤其是能效比,往往很低。
计算存储的构想提出已经有几年,但是其真正成熟并进入主流需要整个存储行业都能定义一个能广泛应用的标准,从而确保不同公司的智能SSD存储都可以有统一的接口。网络存储行业协会(Storage Networking Industry Association,SNIA)为此专门成立了一个计算存储专门工作组,包括了58家成员公司(包括三星,镁光,华为,浪潮等全球各地的存储和系统厂商)。
今年八月底,在经过四年的讨论工作后,SNIA计算存储专门工作组公布了第一版计算存储架构和编程模型标准,这也就成为了智能化SSD的一个里程碑式事件,因为有了这个由业界主流企业共同完成的标准后,行业才能真正实现相应的软硬件设计并且应用在主流产品中。
SSD智能化的技术路径
随着智能化SSD的概念逐渐为业界所接受并标准化,我们预计未来智能化SSD相关的产品也会越来越多,智能化存储产品中对于相关处理芯片的需求也会逐渐增加。我们这里分析一下目前已经公布的智能化SSD产品所使用的相关芯片技术,并且预测未来的发展方向。
三星是智能化SSD投入最多的存储巨头之一。三星的相关产品是SmartSSD Computational Storage Device(CSD)。在三星的CSD系列产品中,集成在SSD中的处理芯片是FPGA。第一代CSD于2020年11月发布,其中集成了Xilinx FPGA。而第二代CSD则在今年七月刚刚发布,其中集成的处理芯片仍然来自于Xilinx(AMD),只是与时俱进更新成为了Versal Adaptive SoC(其中包括了FPGA以及ARM核)。根据三星的介绍,其第二代CSD产品可以在本地完成数据过滤,数据压缩和格式转换,从而可以将存储服务器的能耗降低70%,改善存储服务器的CPU负载高达97%。
三星使用的FPGA方案更注重灵活性,因为FPGA具有可编程性,因此对于用户的软件接口和相关任务有较好的兼容性。根据三星的介绍,其第二代CSD上运行的主要是客户编写的软件和IP,因此使用FPGA来保证最大的灵活度和兼容性也在情理之中。
除了三星之外,初创公司ScaleFlux也发布了其智能化SSD系列产品。去年十一月,ScaleFlux发布了第三代智能化SSD产品CSD 3000。其技术方案与三星最大的不同在于使用了ASIC SoC方案而非FPGA方案。其SSD产品中集成的SoC包括了八核ARM,硬件加速引擎(包括数据压缩,数据加密,数据匹配以及哈希算法的加速),以及闪存和PCIe接口控制。
比较使用FPGA和使用SoC的两种技术方案,FPGA技术方案灵活度高,在出货量低的时候NRE成本较低,但是在大批量出货后成本可能会成为其瓶颈;而SoC则正相反,灵活度不如FPGA,NRE成本很高,但是大批量出货后成本会具有优势。我们认为,随着智能SSD逐渐为主流认可,一方面相关的标准会慢慢固定下来,另一方面出货量会逐渐变大,因此SoC方案在未来更具有吸引力。但是,FPGA方案并非一无是处,我们认为不同的客户会对于其SSD产品的计算和软件具有定制化的需求。在这一方面,我们认为最终的SoC产品也会需要有一定的可编程和课配置能力,从而能满足客户在定制化方面的需求。
计算存储的竞争格局与未来市场
随着大数据和人工智能的继续演进,我们认为智能化SSD和计算存储也将会继续得到更多应用。如前所述,目前对于计算存储投入最大的厂商包括传统存储巨头(如三星)和初创公司(如ScaleFlux)等,而未来势必会有更多的公司投入这个市场。
就竞争格局来说,三星是目前主流存储公司里面对于计算类存储投入最大的,目前已经有产品出货,未来可望也能积累最多的相关经验,获得领跑地位。其他主流厂商目前处于研发状态,例如SK-Hynix今年早些时候和美国的洛斯阿拉莫斯国家实验室联合研发了一款用于加速数据检索的CSD,这是研发的一个里程碑但是尚未处于出货状态。当然,由于产品研发总体而言属于早期阶段,初创公司也有机会能获得市场份额。
对于中国公司来说,智能SSD是一个很好的机会。目前产品的门槛还不是很高,主要需要的是对于大数据任务的理解以及对于SoC设计的经验。中国有全球最大的大数据产业和相关的互联网公司大客户,同时在相关SoC设计方面中国的公司经验并不弱,因此我们认为这个领域在进入主流之后,我们也预期会看到中国公司在市场上的身影。