首页>微信动态>【企业级】存储那些事

【企业级】存储那些事

本文是一篇有关企业级存储的非典型、入门技术、概括型文章。若需要深究存储这个玩意,平时还是需要多关注门户媒体信息、翻阅Datesheet和White paper。咱就聊聊一提到存储,嘴里“哗、哗”就想表达的那些话。


关于存储

来自百度的解释:

名词:提供数据临时或长期驻留的物理媒介或设备;
动词:保证数据完整安全存放的方式或行为。

在企业IT环境当中,有数据就需要存储,有没有专业存储设备往往可以直接反映出企业对IT建设重视度。当然,”富人“和”穷人“的实现需求方式和思路是不一样的,下面分别还原他们在需求沟通场景时的对话。

A:这样吧,我们就买一台多盘位的塔式服务器,配大盘,做RAID5,不用hotspare,装个Win2008或者FreeNAS / Openfiler 之类的系统。另外,如果有配置较好的台式机我们自己拿过来顶一顶也是可以的。

B:EMC,你们那MCx多核技术到底管不管用?会不会有IO和延时瓶颈?要不把你们FAST Cache的加上吧,或者再多配一些SSD,把FAST VP也一起打个包,反正你们软件都放在Suite一个软件套包里面卖了。容量一定要够,未来5年我们的数据容量增长要求,一步到位我比较省事。

备注:FAST Cache是EMC存储全局二级缓存技术,对于特定应用类型的数据读写性能会起到加速作用;FAST VP是EMC存储的自动分层技术,通过策略透明的数据位置迁移(SSD、SAS、NL-SAS)以实现容量以及性能方面苛刻的均衡要求。


存储系统产品架构的通俗理解

在软件层面,包含了运行环境、驱动、文件系统/存储功能等;而一般来说,硬件主要由控制器(或机头)、扩展柜等组件构成。


比如,NetApp的存储OS叫做“Data ONTAP “,“WAFL”则是NetApp的文件系统,这些所谓的“软件”是“安装”在控制器上的。控制器提供与主机的物理连接、并接收/执行/返回主机的数据读写请求或结果,而扩展柜提供数据磁盘的堆积。控制器和扩展柜的关系好比老式的货运列车,车头提供传动动力,而普通车厢用来押运货物。

另外,前几年企业级存储很多都通过专用ASIC芯片来实现某些特定存储功能(加密、压缩等),而现在流行的做法是“X86架构CPU+全软件化”的方式(通用X86架构CPU的发展依然遵循摩尔定律,其计算处理能力已强到富余),这也印证了“一切能被软件代替的技术终将都会被取代”这句话。


存储在企业IT环境中,作为生产/业务数据关键支撑设备和平台,其扩展能力是很多企业采购前期技术评估的重要方面。通常,存储有两种容量扩展方式,纵向扩展(scale-in)和横向扩展(scale-out),这也是存储的一种分类方法。纵向扩展是靠增加扩展柜来实现容量扩展,而横向扩展通过增加节点(控制器+扩展柜)的方式兼顾了容量和性能两方面的提升。


我们比较熟知的一些scale-out存储品牌及产品系列,比如Dell—Equallogic、EMC—Isilon、IBM—SONAS等,其中华大基因的HPC场景中,通过运用EMC的Isilon存储提供了HPC高速的并行数据处理对IO、吞吐以及容量的要求。横向扩展存储属于比较宽泛的一个类别,有时候可以叫“集群存储”、“海量存储”、“云存储”等,“分布式存储”也具有横向扩展的特征。

近几年来,陆续又有一些与横向扩展密切相关的产品形态问世,比如“ServerSAN”、“SDS”、HCI等,说到底都是“软件定义XX”技术。目前在这片新开辟的竞争市场里,已经有VMware vSAN/ EVO:RAIL、Nutanix、Simplivity、Maxta、Nexenta、EMC ScaleIO等,可谓水深火热。在技术层面,不同的厂商,分布式文件系统、数据副本、校验等技术实现,以及元数据处理的方式都有非常多的差异。

评判标准

性能:IO、吞吐性能指标;

扩展:可扩展能力,主要是支持磁盘数量、可用容量等维度;
协议:支持的文件以及块协议种类的丰富程度;
功能:集成功能的丰富程度;
可靠性:无故障运行时间/总评估时间周期;

可用性:系统长时间无故障运行的能力;


SPC是权威的基准测试,乃兵家必争之地。其中,”SPC-1"其主要衡量存储系统在随机I/O负荷下的吞吐量(IOPS),"SPC-2"则主要衡量各种高负荷连续读写应用场合下存储系统的带宽(MB/s)。各大存储厂商会对彼此产品的SPC测试结果保持高度关注和投入,然后就出现了类似“XX打破SPC-1基准测试记录!”的媒体报道,进而匆忙就被拿去刺激用户和竞争对手。关于可扩性方面,EMC的第三代VMAX 400K目前支持到了4.7PB的裸磁盘容量、5760个磁盘、16TB的全局缓存,远超曾经站在存储高端巅峰的HDS,另有NetApp FAS的高端型号参数也是几近变态的地步。


分类

按扩展分:纵向扩展存储、横向扩展存储;

按协议分:NAS/文件存储(CIFS、NFS等)、SAN/块存储(iSCSI、FC)、Unified Storage/统一存储(全协议支持);
按角色分:主存储、备份存储、归档存储等;
按介质种类分:机械盘存储、混合盘存储、ALA/全闪存存储等;

多年前,EMC君和NetApp君就结下了“梁子”,看看他们是怎么斗嘴的。

E君说:“首先我承认NetApp他们的NAS做得很好,但Block数据服务不是原生的,其iSCSI和FC所建立的LUN不过是WAFL文件系统上的一个大文件而已。说白了,就是假的、模拟的,所以他们的性能、安全性方面是不及我们的。你看我们的存储,是在Raid Group上创建LUN直接映射给iSCSI、FC连接的主机端,能提供密集大型I/O并发访问的数据库应用使用。并且我们的文件服务是通过各自专门的控制器输出,互不干扰,安全可靠”。


N君辩解道:“打了这么多年的‘Unified Storage’的招牌,你们哪里统一了?Control Station、X-Blade、SP三种硬件,还要分别用Liunx、DART、FLARE三种操作系统来驱动,File和Block访问明摆着是分别由不同的硬件和操作系统提供的,而我们NetApp就做到真正的Unified Storage架构,一套硬件+一套系统!你们连重删都还停留在File-Level的,何况价钱这么贵”。

根据最新国内企业级市场反馈来看,用户的选择好像都不止为传统一线品牌买单,华为、浪潮、曙光、联想等国内厂商都有不错销售表现,其实这就是存储红海市场的基本特征。

其实,建议企业用户在买什么存储的选择上,要贴近自己的真实需求和采购预算。相较于“网红”、“流行款”,近期涌现出的另一批次高端产品,比如NetApp收编的SolidFire、EMC 收编的XtremIO、Pure Storage、Nimble Storage等,作为AFA(All Flash Arrays)这个异军突起的领域,感兴趣的朋友可以多加关注。


功能特点

RAID:RAID组成员盘的磁盘空间存放生产数据时,会伴随着校验,以应对成员磁盘损坏级别的故障;


精简配置/Thin Provision:通俗来讲,可以理解成空间“过量分配”技术;

快照/Snapshot:高效的数据状态记录手段。常见的技术实现方式有Cow(写入时复制)、Row(写入时重定向)等。Docker文件系统里面也运用到了Cow技术;

克隆/Clone:某状态下的数据快速副本技术,一般是通过调用快照技术来实现;

复制/Replication:数据的本地、异地复制,多运用于容灾用途;

压缩/Compress:数据压缩,也是较为常见的空间节省技术;

去重/De-duplication:重复数据删除技术。不同的重删方式会对应不同的重删效果以及对附加消耗存储计算资源,有基于文件级File-Level的、有基于块级Block-Level的,有定时策略重删、有实时在线重删,有定长重删、有可变长重删;

多路径/Mutil-Path:旨在为应用主机提供冗余的数据通信链路,以避免因HBA Card、Storage Switch等方面的单点故障造成存储服务的宕机;

高速缓存/Fast Cache:通过缓存命中算法结合SSD,实现对存储全局性能的加速;

自动分层/ Automated Tier:通过策略透明的数据位置迁移(SSD、SAS、NL-SAS多层级之间)以实现容量以及性能方面的均衡要求。


其中,缓存、自动分层是有关性能优化机制。功能精简配置、压缩、去重属于存储空间优化机制。 RAID、快照、克隆、复制、多路径是数据/应用可靠性优化机制,其实即便这样,也不能全部代替传统备份和容灾,只可以说是互补或者增强。因为,存储作为“应用无关性”的底层的基础设施,很难做到应用识别。


当然,在VMware vSphere 6.0之后的版本环境当中,已经有诸如DELL、惠普、NexGen、Nexenta等存储厂商积极拥抱VMware Virtual Volume(VVOL)。VMware  Virtual Volume虚拟卷功能提供了一种的新的范例,可以让单个虚拟机和它的磁盘(而不是LUN)成为存储系统的管理单元。

Virtual Volume将虚拟磁盘和其他的虚拟机文件封装起来,原生地储存在存储系统上。同时,通过使用专门的API接口(vSphere APIs for Storage Awareness,VASA),存储系统可以感知到虚拟机和它们相关的内容。通过VASA,vSphere和下层存储系统可以建立起双向的带外(out-of-band)通信,使得数据服务和一些虚拟机操作可以卸载到存储上,比如快照、克隆等。

即便是这样,某种类型、场景的应用数据在经过快照或克隆之后,可能会出现应用一致性问题,当然静态的、非结构化数据应该问题不大。毕竟没见过通过存储的快照、复制来保障证券交易系统的数据服务的连续性的。人家那上的是“两地三中心”灾备解决方案。比如“EMC VNX”+“ EMC VPLEX” +“EMC RecoverPoint“+“VMware vSphere”+“Oracle RAC”的多产品组合方式,可见光存储还是远远不够的,不结合应用层,应用和数据的有效保护是很难落地的!否则CommVault 、Symantec、CA、Vision、FalconStor、Veeam等DP领域的厂商何以生存。


结语

以上是应用场景图,还有太多太多,就不一 一例举了。不管是现在还是未来,都必将是数据的时代,有数据,就一定会有存储。这样的时代背景下,国内外存储厂商还会再推出何种形态、功能特色的产品呢?我们一起期待吧!
 
篇幅和技术有限,ServerSAN、HCI、AFA、SDS、对象存储、重删、自动分层等这里就不再多说,这些足可以另起主题加以探讨,这样才能更多的了解到存储领域的神奇魅力。




云舒网络官方微信二维码