过去十年,随着技术的颠覆性创新和新应用场景的大量涌现,企业IT架构出现了稳态和敏态的混合化趋势。
在持续产生海量数据的同时,这些新应用、新场景在基础设施层也普遍基于敏态的分布式架构构建,从而对存储技术提出了新的要求。
正因如此,分布式存储凭借高安全性、可靠性、可用性、易于扩展等特性,在敏态业务中得到了快速发展。短短几年内,国内分布式存储增长率节节攀升,市场规模不断扩大。
中国信通院调查数据显示,2021年中国分布式存储市场规模达到178亿元,年增速44%;预计未来三年,市场仍将保持40%以上的增长率。
尽管市场上的分布式存储产品和解决方案层出不穷,但如何提高企业存储资源利用率,既要“存得下”,又要“读得快”,还要“成本低”,其实是一件非常不容易的事情。
在天翼云最新发布的存储资源盘活系统HBlock中,我们看到了分布式存储的新“解题思路”。
企业“沉睡”
存储亟待“盘活”
随着业务的发展,企业不断采购服务器进行现有业务系统更新以及新业务系统搭建。为了满足系统性能和升级扩容等要求,企业一般购买超过实际数据容量需求3-4倍的磁盘,不可避免会造成资源闲置。
《计算机世界》的一篇文章曾指出“数据中心30%的物理服务器处于沉睡状态”。麦肯锡公司发布研究也表明,有高达30%的数据中心服务器“功能失效”。由此可见,优化“沉睡”的服务器将会给企业带来巨大收益。
目前,国内外企业普遍存在大量的利旧服务器需求,但是经常会面临异构硬件难兼容、旧型号设备与软件不适配、弱电弱网等混沌环境带来的不稳定和降速问题。
在实际方案设计中,存储盘活效果也并不理想。究其根本,主要有异构存储和数据孤岛两大原因:
在企业IT系统中,存储设备往往来自不同供应商,这意味着不同的底层架构、不同的管理界面、功能、性能以及运维升级的操作都会有很大的差别。一旦存储升级,就必须找到相应的供应商进行操作,因此企业很容易被供应商所绑定。
同时,由于存储设备来自多个厂商,多个存储网络之间很难实现相互协作,数据孤岛无疑将极大的增加企业存储系统的管理难度和运维成本。
除了盘活利旧、解除存储供应商绑定等需求,企业也面临着绿色数据中心的挑战。
在2030“碳达峰”背景下,企业积极探索如何响应数据中心能源消耗巨大的课题,而通过摆脱沉睡服务器和提高能源效率,是解决数据中心资源空跑、利用率低等问题的必经之路。
不难发现,无论从何种角度考虑,盘活企业存储资源已势在必行。在这种背景下,分布式存储凭借灵活、可靠性强、扩展性强等优势,成为解决存储资源闲置、提高资源利用率的理想技术路线。
就在今年,天翼云推出了一款革命性的分布式存储产品“存储资源盘活系统HBlock”,正是针对盘活存储资源这一挑战而诞生的。作为业内首款存储资源盘活系统,天翼云HBlock是如何解决这一棘手难题的?
天翼云HBlock
为存储“提质增效”
正如前文所说,盘活存储资源并不是件容易的事,为了解决异构存储、数据孤岛等挑战,天翼云HBlock创新性地提出了纯软件、全用户态的分布式存储产品形态。
首先,HBlock全部运行在用户态,与硬件驱动程序完全解耦,因此支持多种指令集架构、不同型号配置的服务器混合组成集群,可与企业现有应用混合部署于同一操作系统中,且不影响现有应用的运行,以尽可能盘活更多的存储资源。
其次,作为一款全用户态的纯软件,HBlock安装包只有170MB左右,可以安装在任何主流Linux操作系统上,把分散在各服务器中的存储空间整合成高性能虚拟资源池,通过分布式多控制器架构保证了低延迟、高可用、易扩展。
同时,HBlock还提供功能全面的控制台、命令行,以及完善的API接口,通过标准存储协议为上层应用提供分布式存储服务,解决了异构存储与数据孤岛问题。
事实上,想要解决盘活存储资源的挑战,还有一个重要的前提,就是要满足企业对于数据存储稳定性和业务环境高适应性的要求,才具备实际的落地性。
但是,想要提高稳定性就要限定环境,想要适应各种环境就容易出现不稳定,那么天翼云HBlock是如何解决这一难点的呢?
据天翼云国际业务事业部存储研发专家武志民介绍,天翼云HBlock主要从高可用、高可靠、高性能三个方向进行了技术攻坚:
在高可用方面,采用基于MPIO的“一主多备”方案。可在数据层面实现秒级故障切换,提高服务可用性;集群模式下所有服务都采用冗余方式部署,实现从服务器整机、单链路到单个磁盘部件发生故障而不受影响。
在高可靠方面,支持多副本和纠删码,每个存储卷都可以选择自己的冗余方式。当一份数据丢失的时候,可以通过其他的冗余数据,将丢失的数据快速重建,降低数据丢失的概率。
同时,支持节点、磁盘两个级别的故障域,以适应多种部署需求。在数据校验方面,支持客户端服务器校验、集群内部全流程校验、多台服务器间数据校验等多种校验方式,严格确保数据的一致性,并且在检测到异常的时候能够自动启动数据恢复进程。
在高性能方面,HBlock通过写缓存与读缓存的优化设计来实现。
其中,写缓存支持三种缓存模式:WriteBack, WriteThrough, WriteAround,分别适用于对读写性能要求较高、对数据的安全性要求较高且写少读多、对数据的安全性要求较高且写少读少的场景。
读缓存会根据网络距离和节点负载选择最合适的节点去读取数据,并根据不同用户场景自动调整缓存大小、判断缓存预读,从而大幅度提升客户端小IO顺序读的性能,减少客户端读请求的响应延时。
测试数据显示,在全SSD环境下,HBlock单卷IOPS可达15万次,读写延迟200微秒。
在规模层面,节点数可以达到1024,支持PB级别存储资源池。支持弹性扩容,不中断业务,可随时下架高能耗设备,替换为低能耗设备。以上数据均为业内上游水平,全面超过了开源Ceph。
值得注意的是,目前市场上绝大多数的分布式存储产品都在高可用、高可靠、高性能方面下足了功夫,但为何天翼云HBlock在盘活存储资源方面独具优势?我们认为有两个特点值得关注:
一是,大多数的分布式存储产品,其关键核心模块都是依赖于Linux内核,按照软硬一体的模式进行售卖。而HBlock通过自主研发,存储软件与硬件驱动程序完全解耦,因此适用于市面上通用的标准化服务器,兼容常见的Linux操作系统等。
二是,作为一款主打盘活、提高资源利用率的分布式存储产品,HBlock内置利旧检测工具。用户可以在正式部署前,全面检测自身硬件状态并进行评估,以了解是否适合部署HBlock,以及部署后会取得什么效果。
总体而言,天翼云HBlock不仅可以满足企业对于数据存储稳定性和业务环境高适应性的要求,还可以利用全部空闲存储资源,帮助企业解决存储资源闲置的难题,真正实现降本增效。
深入场景才经得起考验
如今随着企业业务应用类型的多元化,存储的使用场景也在走向多样化。
一款存储产品能否在性能、稳定性、可靠性等方面跟上应用趋势的迭代步伐,适应各种业务场景的新需求,决定了它是否能够真正应用落地。
天翼云HBlock正是掐准了不同场景对于存储需求的脉搏,在释放企业数据价值的过程中大展身手。目前,HBlock不仅支持私有云存储场景,还支持混合云存储、第二存储等多种需求场景。
以金融行业为例,由于企业对信息安全的要求高,普遍采用私有云建设模式。
而HBlock支持构建私有云存储底座,灵活纳管各类服务器,它可以替代传统SAN存储,支持对接OpenStack、Kubernetes,也可以在上面部署VMware、KVM等主流虚拟化平台来支撑业务;适配多种芯片架构、国产化操作系统,做到安全又高效。
同时,HBlock支持与公有云对象存储连接,实现混合云存储,提供本地和云端两种部署方式,并支持不同缓存策略,实现存储空间的按需使用、弹性扩展。
此外,HBlock还适用于第二存储场景,存储非关键数据,包括备份和容灾数据、视频监控数据、归档数据等,提高服务器资源利用率,实现业务快速上线。
目前,HBlock已在政务、金融、能源、医疗、工业互联网等行业场景中实现广泛应用。
也正是基于存储核心技术创新,以及深入场景释放企业价值,天翼云HBlock斩获了“可信云2022-2023年度技术最佳实践-基础服务类-分布式存储技术”大奖、第六届分布式存储高峰论坛“2023分布式存储产品金奖”等系列大奖,获得了业界的充分认可。
结语
据Gartner预测,到2024年,全球50%的存储容量将以软件定义存储的形式部署。
可以肯定,未来十年,分布式存储的相对市场份额将不断增长。面对愈加复杂的业务场景,企业对分布式存储系统也提出了更多新的需求。
天翼云存储资源盘活系统HBlock正是把握住了时代的机会,敏锐洞察到企业的切身需求,为企业有效盘活存储资源、提升基础设施运营管理水平、实现绿色高质量发展打下了坚实的存储底座。
相关阅读
传统架构发生深刻变化,分布式云存储将成为新一代基础设施
国云筑基“翼”气风发,天翼云以科技创新绘就数字中国蓝图
数据大爆炸时代,云存储重塑云中数据活力
东数西算不止于“算”,更需“新存储”