- 2018-01-29
- 阅读()
- 来源:互联数据
这年头IT市场充斥著各种忽悠词汇,我举个例子,当客户或是终端使用者问到SSD(固态硬盘)以及HDD(机械硬盘)彼此之间该怎么最有效的使用时,大部分的原厂销售代表就拿出个下像面的图并用几句话带过,不外乎就是SSD会被放在比较上层处理小IO的应用,大块数据就是扔到HDD上,结束。说实在的,连我自己搞技术营销的都说服不了自己,我还不敢给客户这样说呢……
图1: 存储分层金字塔
在一个加班准备吃夜宵的餐馆中,遇到了几位大婶阿姨,一直称赞咱们东芝做的冰箱很耐用,问我做什么的,于是想了个法子来解释给他们听听我平常在销售的是什么。
图2: 像厨房一般的存储分层
如果平时存放的资料就像是食物的话,那保存食物的地方不外乎就是几个,厨房里的冰箱、冷冻库、微波炉、烤箱甚至咖啡机。平时煮菜或是备料时,也都会考量到何时要用到食材而分门别类的放置:又或是根据急迫性来分类,例如浓缩咖啡机的快速冲泡、加班的人们速速微波便当准备敢下个会议等等。
具体来说,数据中心的存储设备就有如这个all in one厨房设备一样,保存者食物也时不时地江餐点端上桌。大致来讲,从三个面向来探讨。
一、比例原则
也不是所有的资料都是硬梆梆的只放在HDD或是SSD这两种二分法而已,而是都会放或是都会待过。而由于应用软件所侧重的性质不同,其资料放置在SSD或HDD的比例有所区隔而已。举个例子,近期在我是歌手很火红的视频-萧敬腾所翻唱的以后别做朋友,由于太火了,大部分个省份的人都会想要即时点播来看,这时候可能像腾讯视频、Bilibili等软件就会把这段视频先缓存起来,放置在各区域的CDN服务器当中,以利各家视频软件达到所谓“秒级点播”的服务。等过一阵子空间得重新配置或有更火的视频出来之后,萧敬腾这段视频就会慢慢由上往下移到HDD中存放,让各位粉丝们回溯寻找。
二、应用导向
从图2我们看到,在线交易(OLTP)、推荐系统或金融支付这几类讲求实时性以及低延迟的应用,就会要求较多的数据缓存在PCIe SSD类别类,因为其软件性质要求的速度和延迟下,必须得用这个级别的SSD才能达到,所以有一部分的企业级应用标榜著QoS协议,也是跟其后台租用这类服务器有关。在举个例子,很多国内BAT数据中心都会使用分布式运算,Hadoop可能是目前最大宗的,其在资料分开运算的过程中,会产生大量的临时性文件( temporary data ),需要超越2.5″ SAS HDD能耐的东西但又不需要太高端的速度,因此有几家则是使用SATA SSD作为这个媒介,大量又快速的存储下去之后又马上洗掉,就好像西餐厅里的牛排一样,用完餐之后洗乾净在服务下一位客户。
三、热度频率
前面也稍微提过,应用软件的性质会决定了大部分的资料在什么层级的存储进行。试者想想当我们要看在5年前微信朋友圈中发生了什么事,那个往上滑而不断读取的圆圈进度条一直在转,就是在朝腾讯放冷存储的HDD集群们捞你的资料,毕竟在现今互连网的风潮之下,大家都不记得(或是不在乎)前几天中餐吃了哪家餐馆的时候,很少有人没事一直看自己还是18岁时候的照片,跟使用的热度或是一般会访问的频率有关。另外,政府机构其实很要求这些互连网巨头、电信运营商将资料都保存十年以上,可能是让一切都有凭有据的准备也有可能是秋后要大算帐……。但就是跟使用行为、访问频率、群体热度有关连。
结语:从粗放农业过渡到精致农业
各家数据中心目前算盘打的愈来愈精了,从冷却、用电、通风、人员管理、资安以及硬件资源的配用,都已经快到出神入化的程度(甚至是自己做SSD了)。也连带的让数据中心在系统设计的架构上、采购行为和配置考量点都与传统IT完全不同。企业内部的私有云架构可能还像是粗放农业一般,有些许的资源闲置在那边或是大材小用,然侯数据中心就是运算、网路、存储都切的很开并且分配的很细致,尽量不要有一丝的浪费!