在过去,分布式存储是大容量存储的代名词,而大容量跟闪存完全完全冲突。因为,闪存的价格实在是太高了,用户对于分布式存储的要求是:要更高性能,要高带宽,但成本要低。
好在,随着闪存技术的发展,单位容量的成本不断降低,闪存大规模使用成为可能。同时,随着新兴应用对存储性能有了越来越高的要求,分布式闪存存储系统开始走进现实。
从技术维度来看,闪存介质很贵,要如何恰如其分地用到分布式存储中呢?
分布式存储系统由来已久,当互联网、物联网、云计算、大数据等技术带来海量数据时候,人们希望用分布式存储的高性能、高效率来处理海量数据,分布式存储得以加速发展。
分布式存储的扩展性决定了它是海量数据的必选项,但只有扩展性是不行的。考虑到数据类型的多样性,考虑到工作负载的差异性,最终,都会对存储提出新要求。
比如,如何解决海量小文件的随机读写性能问题,如何解决数据规模达到一定程度后的性能问题,如何稳定表现出高性能,如何提供多样化的接口来为多个系统提供统一存储。
分布式存储的性能问题可以先考虑闪存,许多分布式存储厂商通过利用闪存的性能优势把性能提升较高水平。
除了带宽以外,小文件的处理效率也很重要,比如机器学习训练的场景,EDA设计的阶段都需要极高的小文件随机IOPS性能表现,如果性能不足,轻则影响工作进度,严重的甚至能带来重大损失。
从根本上来讲,由于分布式存储系统的IO路径比较长,大量小文件影响了元数据和数据管理效率,最终影响到性能,减少IO路径可行,但最主要还是通过合并小文件,并基于闪存做一些优化来提升性能。
通过数据分层技术,将热数据放在闪存存储,甚至是英特尔傲腾为代表的高性能存储介质上,而将温数据放到磁盘为主的介质上,将冷数据归档到磁带上。
最后实现成本和性能方面的新平衡,好钢用到了刀刃上。
产业动向——闪存存储越来越多
年,许多存储厂商都推出了基于闪存的分布式存储解决方案。
对于集中式以及分布式的SAN块存储来说,闪存几乎已是标配;分布式的文件存储中,闪存也占据重要地位,常见的分布式文件存储也都提供对象存储接口,可以说,基于闪存的对象存储时代已经来了。
我们来看市场上常见的存储厂商在分布式闪存存储系统方面的布局:
戴尔的横向扩展NASPowerScale(原Isilon)提供五个闪存配置的型号,包括PowerScaleF,PowerScaleF,PowerScaleF和IsilonFandF,PowerScale虽然是文件存储,但是也提供S3接口,一些场景下也能当对象存储用。
对象存储方面,戴尔在年11月发布了第一块基于闪存的方案——DellEMCEXF,基于NVMeSSD构建,使用了NVMeOF,大大提升了节点间的通信效率和集群规模。
StorageGrid是NetApp(联想凌拓)的软件定义的的对象存储方案,年开始,StorageGrid也开始提供闪存配置的方案,StorageGrid不仅支持标准的S3和OpenStackSwift访问协议,还提供了文件存储访问协议。
PureStorage是闪存阵营的铁粉,专注于闪存方面的创新。PureStorage的FlashBlade也基于闪存来构建,它提供文件和对象存储,FlashBlade的横向扩展元数据架构可以处理数百亿个文件和对象,性能强大,提供丰富的数据服务,适用于HPC、数据分析场景。
此外,ScalityRing、ScalityRing、WekaIO也都提供文件和对象存储融合平台,也都面向NVMe闪存存储介质做了不同程度的优化。
国内市场上,华为OceanStorPacific也是一款横向扩展的分布式存储产品,同时提供分布式文件和对象访问接口,有丰富的功能特性,目前,OceanStorPacific和OceanStorPacific分布式存储都提供了闪存配置。
年,紫光股份旗下新华三集团推出国内首个NVMe+SCM分布式全闪存储——X全闪节点,实现速度与效率的提升,全面满足企业在高性能计算、基因测序、人工智能、8K超高清等全新场景下的业务需求。
浪潮推出了G6全闪分布式存储,容量方面能达到EB级,性能方面,通过卸载CPU的网络处理复杂,最终达到了亿级IOPS水平,提供包括文件、块、对象和大数据四种服务。
XSKY是国内的一家分布式存储厂商,旗下星飞0/0一款分布式全闪存系统,支持包括SCSI/iSCSI、FC、RBD、S3、NFS、CSI、SMB、FTP等多种协议。介质方面,它支持低成本的QLCSSD,在成本和性能方面有所突破。
青云的QingStorNeonSAN是另外是一款面向企业关键业务的软件定义分布式SAN存储系统,采用全闪架构与RDMA网络设计,时延亚毫秒下可达数百万IOPS,单卷容量可达百TB级别,作为分布式存储,在性能与容量方面都有许多突破。
大道云行是国内一家分布式存储服务商,旗下有一款名为FASS的分布式全闪存储,它提供的是分布式块存储服务,采用全对称分布式架构,支持从3节点扩展到节点。性能方面,3节点就能达到千万级IOPS,微秒级时延响应。
从实践的视角来看,闪存付出的成本和收益如何?
以往对象存储常用于归档和备份,而现在,对象存储随着性能的提高,在更多场景中释放更多价值。
ESG的一篇报告显示,数字化转型和新兴工作负载正在推动全闪存对象存储的发展。而且,从调研的数据来看,全闪存对象存储并不是用更大成本换取更高性能,而是既能提升性能又能降低成本。
该报告的调研人群颇具代表性,调研了位负责存储决策和基础架构战略的IT专业人士,这些人所在的组织有人以上,组织内部活跃的非结构化数据量超过TB。
调研的结果显示,目前全闪存对象存储尚处于早期阶段,但未来将会普及。调研的数据显示,95%的企业采用了闪存存储系统,只有23%的用户在使用全闪存对象存储(All-flashobjectstorage)。
与此同时,绝大部分(87%)的没有用闪存的企业计划将做闪存相关的技术评估。
报告指出,云原生容器工作负载、商业智能、数据分析和机器学习等新兴负载都需要现代化的基础设施,而现代化的基础设施都需要全闪存对象存储。
ESG的数据显示,28%的受访者认为,全闪存对象存储是游戏规则的改变者,另外49%的受访者表示,全闪存对象存储对于他们的组织产生了重大影响。
ESG的报告里还提到了全闪存对象存储在多个场景中的价值,首先,能提升海量数据存储的访问性能,同时,还有助于提高关键性能指标,比如,SLA,提升资源利用率,降低TCO等。
换句话说,全闪存对象存储并不是用更大成本换取更高性能,而是既能提升性能又能降低成本。
将于7月28-30日举办的年全球闪存峰会(线上)期间,我们将举办分布式全闪存存储论坛,邀请相关领域的厂商分享更多技术创新和实践创新的内容,期待您的