导读:DSS2018上,浪潮提出在云数智驱动的新数据时代,超大规模/大规模数据中心不断推动存储基础设施做出根本性改变。EB级容量、亿级IO、弹性架构、AI智能管理,已成为浪潮超大规模软件定义存储(Large-Scale SDS)的关键词。
超大规模数据 让存储发生根本改变
IT技术的不断突破和广泛应用,让物理世界和数字世界逐渐"破壁"。随着物理世界发展局限性的日益显现,人们意识到数字世界的扩大不能只是信息的重复叠加。物理世界和数字世界应打破壁垒,相互感知、充分交互,最后实现高度融合。受两个世界融合的影响,云计算、物联网、大数据、人工智能、区块链等新技术快速发展,数据指数级爆发,数据中心规模如同滚雪球般越来越大。
据麦肯锡估计,过去三年超大用户对数据中心的投资达到了1850亿美元,仅2017年就约有750亿美元。超大用户所占据的网络流量达到整个数据中心网络流量的近1/3,未来三年,该比例将跃升至55%以上,而这些用户所控制的数据中心IT基础设施将达到总数的50%以上。
云计算、大数据、AI等新技术驱动数据存储变革
在旧数据时代,存储面对的应用主要是数据库、文件和流媒体这类传统应用;而今天,在新兴技术驱动下,存储主要面对的是Cloud、Big Data和AI这些大规模数据应用场景。传统存储在性能、安全性、可靠性上的局限性,让他们在面对这些新兴应用时,往往表现出了很大的瓶颈。
首先是存储规模。从云计算行业来看,云计算的用户与应用众多,平台随时都在运行成百上千、甚至成千上万业务虚主机,而且业务负载随时在动态增长,这样后台就需要巨的集群规模、存储空间、IO性能来作为支撑;从大数据或者AI来看,其数据量非常之庞大,可能拥有十亿或者百亿的文件,构成一个庞大的数据链。这就决定了云、大数据或AI需要借助一个很大的集群,实现海量数量的管理和高性能数据运算。
其次,新数据时代对存储性能提出了很高的挑战。无论是面向文件和对象的OPS的性能,还是面向云虚拟机环境下IOPS的性能,新兴应用对存储系统性都提出了非常高的要求,大规模业务系统的高效运行、数亿网民手机支付的即时响应、车票订票高峰的订单确认、视频应用的高速访问与下载,都要求后台的存储基础设备,拥有百万甚至千万级的IOPS性能、GB级甚至TB的吞吐带宽,以满足前端优质的服务体验。
第三,云、大数据、AI需要在设施资源和数据资源的共享基础上进行再利用,这对数据的共享与管理带来挑战。现在及未来,客户追求的是全局最大化共享,而不仅仅是局部或内部共享。大数据或AI应用实际上需要把一些之前扔掉的数据重新拿回来做分析,扔掉的数据反而会产生很大的价值。数据要实现共享和流动,可能牵扯到几百个乃至更多的数据存储节点,涉及数万个数据卷或者数百万个文件。这些数据资源,需要通过统一架构来支撑、统一管理平台来调度和组织,在共享和管理上有很多技术上的挑战。
软件定义存储主导未来
据Gartner调研,目前大约40%的企业数据存储在可横向扩展的企业数据中心或云数据中心,到2022年,这一比例将超过80%。
在标准通用的硬件架构下,通过存储软件的设计优化,即可打造高性能、高可靠、弹性扩容、管理简单的存储系统,甚至可以感知用户定义的策略和需求, 并在策略的驱动下自主调整工作状态, 这就可以称之为软件定义存储。软件定义存储把存储服务从专用存储设备中抽象出来, 这样就降低了与硬件的耦合度, 可以更广泛的选择和使用更多配置与更高性能的通用硬件,并开发出更丰富的人工智能、云计算管理、大数据应用接口,匹配满足新数据时代的六大业务需求。
浪潮SDS 多维出击
从产业发展角度来看,只有跨越物理世界和数字世界的交点(即进行新数据时代的业务转型),才能获得完整的产业机会。而IT厂商的使命,就是为各行各业的再一次转型提供专业的数字化产品和方案。只有通过技术创新,去帮助用户设计架构和建设基础设施,促进用户做出更好的业务决策或者创建更多的业务机会,从而帮助企业增加收入,在商业方面才有可能更加成功。
浪潮超大规模软件定义存储
首先,提升元数据管理能力,让EB级数据存得下、取得出。
浪潮软件定义存储之打破了传统文件系统的元数据集中式存储和管理这一限制,对浪潮软件定义存储集群系统的目录实行分而治之,让集群中所有服务器来一起存储和管理元数据及数据,从而实现负荷分担、负载均衡,实现10亿级别的文件管理。
由于浪潮软件定义存储拥有更为强大的计算资源和存储资源来快速索引文件,所以其容量规模、管理文件数目的能力要远远优于传统架构存储。另外多活元数据服务也是浪潮软件定义存储的显著优势:多个元数据服务形成集群,共同对外提供文件索引服务,并且通过元数据副本、缓存加速、热点目录分片、动态子树分区等技术,来实现负载均衡及元数据服务故障高可用等一系列功能。
目前浪潮软件定义存储系统可扩展至数千个,可以形成EB级海量存储空间、百亿数据文件管理、亿级IOPS和百GB带宽,加上不断进步的数据自动修复和自动运维机制,使之广泛适用于海量数据存储场景。
浪潮参加2018中国存储峰会,展示新数据时代的新存储
其次,从架构到功能,一切皆为场景服务。
浪潮存储很早就看到了云计算、大数据和人工智能对大规模存储的需求,并启动了在软件定义存储方面的布局与投入,并通过Scale-out架构基础上不断进行技术创新和产品迭代,推出了自己的软件定义存储产品AS13000,并在一套架构下实现了文件、块、对象和大数据四种数据服务。
云计算、大数据和AI是智能应用的上层建筑,存储与服务器、网络和云平台则构成基础设施。首先,存储作为基础设施之一,其系统架构是本。架构的一致性和归一性会给数据中心基础实施带来互联互通、共享统管方面的保证,带来全方位的CAPEX和OPEX节省。其次,生长于架构上的新技术、新特性、新功能,则是标,通过这些创新,存储可以完美适配不同的应用场景。
浪潮软件定义存储AS13000的技术优势
最后,从介质到算法优化,从外部到内存,闪存化提升了浪潮SDS的性能。
对于数据访问性能问题。关键应用和虚拟机集群要求高IOPS,全闪存软件定义存储无疑是更好的选择。全闪存储使用固态存储介质技术,比如NVMe、3D xpoint等。通过全闪存软件定义存储内的介质更新,软件算法优化,可以大幅提高IOPS、时延和带宽。此外,基于固态存储技术,浪潮正在将存储技术模块打包,从快速存储向内存存储来改变,带动内存计算技术的发展。在内存计算技术发展起来之后,业界在数据库的设计、应用设计这些方面都要得到改变,而浪潮可以很快适应以上变化,通过产品优化转型,继续发挥在存储方面的积累与技术优势。