• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

分布式存储产品形态及自研硬件优势-6W100

手册下载

分布式存储产品形态及自研硬件优势-6W100-整本手册.pdf  (860.01 KB)

  • 发布时间:2024/8/20 19:46:24
  • 浏览量:
  • 下载量:

分布式存储产品形态及自研硬件优势

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

资料版本:6W100-20240823

 

 

Copyright © 2024 新华三技术有限公司 版权所有,保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。

除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。

本文档中的信息可能变动,恕不另行通知。



1 分布式存储产品主要形态

分布式存储是一种数据存储技术,它通过网络将数据分散存放在多台节点上,并通过软件来集中管理和控制存储资源。分布式存储技术的出现有效解决了传统集中式存储系统所面临的性能瓶颈、扩展难、成本高等问题,广泛应用于云计算、虚拟化、大数据、文件共享、票据影像、HPC、归档备份等场景。

从产品交付或产品组成方面来看,分布式存储产品具有多种形态。

1.1  产品交付形态

从产品交付形态来看,各厂商的分布式存储产品可以主要分为分布式存储纯软件和分布式存储一体机两种类型。

1.1.1  分布式存储纯软件

分布式存储纯软件产品是指存储厂商仅提供软件形式的存储产品。用户可以根据存储厂商提供的兼容性列表,选择并购买适合的服务器硬件,然后将它们组成分布式存储集群。

这种软硬件解耦的交付方式使得用户在选择硬件时更加灵活,但由于软件和硬件可能来自不同厂商,分布式存储系统的稳定性、性能和运维管理能力可能会受到影响。

1.1.2  分布式存储一体机

分布式存储一体机产品是指存储厂商交付软硬件一体化的存储产品,并提供一站式的售后服务。在这种软硬件耦合的交付方式下,存储一体机的稳定性和性能将得到充分的验证和优化。与此同时,资源统一运维管理的粒度也会比软硬件解耦时更加细致。随着分布式存储在企业级数据中心广泛应用,软硬件一体机已成为市场主流。

根据厂商的硬件研发能力,分布式存储一体机的硬件又可分为两种情况:

·     自研硬件:厂商具备硬件的完全自主研发和维护能力,结合软硬件能力进行最优设计,提供自研的专用硬件使分布式存储达到最佳的性能和可靠性。

·     硬件OEM:厂商本身不具备硬件的研发和维护能力,通过OEM第三方通用硬件,然后将存储产品软硬件一体化交付给用户。

1.2  产品组成形态

分布式存储由存储软件和硬件两部分组成。从产品组成形态来看,各厂商的分布式存储产品可以主要分为商用软件+专用硬件、商用软件+通用硬件、开源软件+通用硬件三种形态。

1.2.1  商用软件+专用硬件

商用软件+专用硬件是指存储厂商同时具备软件和硬件的自主研发能力,能够结合软硬件架构和能力进行产品的最优设计,并提供更简便的运维管理和更丰富的软硬件联动功能,为用户交付软硬件一体化的整体服务,例如新华三的H3C UniStor X10000系列分布式存储一体机。

1.2.2  商用软件+通用硬件

商用软件+通用硬件是指使用存储厂商提供的商用存储软件,配合与之兼容的通用服务器硬件,来组建分布式存储。例如,商用软件选用新华三的ONEStor分布式存储软件,硬件选用新华三的H3C UniServer R4900 G6通用服务器,或选用ONEStor兼容性列表中其他厂商的通用服务器。

1.2.3  开源软件+通用硬件

开源软件+通用硬件是指用户使用开源的存储软件,配合与之兼容的通用服务器硬件,来组建分布式存储。这种情况下,开源软件通常由用户自行运维,硬件服务则由硬件厂商来提供。常见的开源存储软件如CephDAOSLustre等。

1.3  各产品形态对比

表1 产品形态横向对比

产品形态

存储一体机(自研专用硬件)

存储一体机(OEM硬件)

存储纯软件+通用硬件

集成方式

研发集成

工厂集成

现场集成

供应商数量

1

1个或多个

多个

管理平台数量

1

多个

多个

硬件选型灵活度

性能

可靠性

运维管理粒度

 


2 新华三分布式存储代表产品

新华三集团作为数字化解决方案领导者,拥有计算、存储、网络、5G、安全、终端等全方位的数字化基础设施整体能力,可提供云计算、大数据、人工智能、工业互联网、信息安全、智能联接、边缘计算等在内的一站式数字化解决方案,以及端到端的技术服务。

在分布式存储领域,新华三的代表产品包括H3C ONEStor分布式存储软件和H3C UniStor X10000系列分布式存储一体机。

2.1  H3C ONEStor分布式存储软件

H3C ONEStor分布式存储软件采用全分布式的架构,可构建统一资源池,向上层应用提供块、文件、对象、大数据统一存储服务,满足结构化、非结构化和半结构化等多类型数据存储需求,为用户提供具备卓越性能表现、低总体拥有成本(TCO)、高可扩展性、高可靠和易运维的企业级存储解决方案,助力用户数字化转型。

图1 H3C ONEStor分布式存储软件架构

 

ONEStor作为一款纯软件形态的分布式存储产品,具备强大的生态兼容性能力,能够全面兼容新华三自研的H3C UniServer系列通用服务器硬件,以及其他业界主流厂家的X86/ARM架构服务器硬件,在金融、制造、政府、互联网、能源、交通等多个行业得到广泛应用。

图2 H3C UniServer系列自研通用服务器

 

2.2  H3C UniStor X10000系列分布式存储一体机

H3C UniStor X10000系列分布式存储一体机采用软硬件一体化设计,最大支持8192个节点的横向扩展,系统性能和存储容量随节点数量增加呈近线性增长,能在单一命名空间下提供EB级的存储容量,能为各行业用户提供海量存储资源池。

·     在软件层面,X10000系列分布式存储一体机所搭载的存储软件与ONEStor基于同一个存储平台研发,采用相同的架构设计,能够提供同样丰富的企业级功能特性。此外,在软硬件一体化的交付模式下,X10000系列产品能够提供更多、更细致的一体化运维功能。

·     在硬件层面,X10000系列产品提供了通用型、全闪型、生态型等多种专用硬件,兼容Intel、海光、飞腾等多种CPU平台。多样化的硬盘部署方案和丰富的机型配置,可有效满足各类应用场景的存储业务需求。

图3 H3C UniStor X10000系列分布式存储一体机

 


3 新华三分布式存储自研硬件优势

新华三具备全面的软硬件自主研发能力,完全掌握软件和硬件的底层架构设计及核心代码,可实现软硬件最佳协同设计和可靠性。相较于其他厂商仅交付存储软件或采用硬件OEM方案,采用新华三自研硬件搭配自研存储软件的分布式存储方案具有多种显著优势。

3.1  更全面的软硬件研发能力

新华三在分布式存储领域具备全方位的自主研发能力,在全国设有六大研发基地,拥有庞大的存储研发团队,以及数百项存储相关的国家发明专利。这为新华三分布式存储产品的性能、可靠性、定制化需求响应速度和场景化方案验证充分性等方面提供了有力保障。

3.1.1  最佳软硬件协同设计

在分布式存储系统中,软件和硬件密切配合,相辅相成。新华三分布式存储凭借自主研发的软硬件技术,优化二者的协同设计,以达到最佳的整体性能和可靠性。

·     在软件方面,通过各种性能优化特性对硬件资源进行系统级的优化分配和调用,充分发挥各硬件设备的性能,提高可靠性,并降低系统集成的复杂性。

·     在硬件方面,根据软件设计、场景需求和成本效益等因素,进行有针对性的硬件选型和研发,确保软硬件协同工作更加高效,从而提高系统整体性能和可靠性。

3.1.2  快速定制化需求响应

依托于全方位的软硬件技术研发能力,新华三能够快速响应用户对存储软硬件的各种定制化需求,提供定制化的分布式存储解决方案,满足用户在存储容量、数据安全性、接口兼容性、业务特性等方面的不同需求,使用户能够更加灵活地定制和部署分布式存储系统,以快速响应业务变化和增长。

3.1.3  充分的场景化方案验证

新华三拥有解决方案级的交付能力,能够联合方案中的其他产品,对分布式存储进行面向场景的专项验证和优化,以满足不同行业、不同应用的数据存储需求。此外,新华三还与各行业领先的ISV建立了广泛而深入的合作,能够获取行业领先的软件和解决方案,并将其与新华三分布式存储产品深度融合,为用户提供更符合场景需求的存储解决方案。

3.2  更充分的硬件方案验证

分布式存储系统在实际应用中遇到的问题不仅仅局限于纯软件问题或纯硬件问题,还涉及许多软硬件配合问题。软硬件之间配合不良可能会导致系统性能下降、稳定性降低,甚至不可用。

纯软件存储厂商通常会基于通用硬件进行兼容性测试,并随产品发布配套的兼容性列表,来指导用户进行硬件选型。然而,如果软件和硬件来自不同厂商,二者之间往往无法实现最佳的协同设计,兼容性测试也较为有限。当软硬件配合出现问题时,纯软件厂商通常难以独立发现和解决问题,甚至需要依赖上游硬盘、RAID卡厂商,这可能导致问题解决时间过长,对用户业务造成严重的影响。

针对这一问题,新华三分布式存储软硬件一体交付方案在研发阶段不仅更加注重软硬件协同设计和调优,还会针对软硬件配合时可能产生的风险制定全面的测试用例。产品在正式发布前,会基于实际业务组网进行数千个测试用例的充分验证,以提前发现并解决软硬件配合时可能发生的各种问题,确保产品能够在实际业务中7*24h连续稳定运行。

3.3  更严格的硬件质量把控

新华三研发产品可靠性中心设立于2004年,由硬件鉴定实验室、跌落实验室、安规实验室、结构实验室、电磁抗扰度实验室、电波暗室、气候环境实验室、高加速应力实验室、器件分析实验室和器件可靠性实验室组成,占地4100平方米,为新华三自研硬件产品提供从器件到整机的严格测试与检验,是新华三产品质量的有力保证。

3.3.1  严格的器件质量管控

新华三产品所用的器件均来自行业TOP厂家,成熟度高、故障率低且供应稳定。产线每年定期开展稽查,对器件实施定制化的生产管控,部分器件实现了“专人、专线、专货、专供”。完善的器件准入审查,可覆盖工艺、可靠性、安规等多个专业领域,确保器件满足行业规范要求。

此外,新华三投入超千万元建立了国内领先的器件材料和破坏性分析实验室,配备有3D X-raySEM/EDX、光学显微镜、金相制备系统等专业器件分析仪器。在严格的器件可靠性管控要求下,即使是主流厂家的量产器件,也保持着极高的器件淘汰率,从而确保器件的优中选优。

3.3.2  卓越的可靠性设计

新华三通过防错、容错、纠错等可靠性设计方法,最大限度地降低产品的失效概率,并确保重要部件故障后仍然可正常使用。

·     防错:采用降额设计、容差分析和故障影响度分析等方法,在使用器件上保留了充足的余量,降低产品的故障概率。

·     容错:对电源、风扇等关键部件采用冗余设计,即使部分部件故障,系统依然可用。

·     纠错:提供完备的故障检测功能,能够自动定位故障原因并给出改进建议。

3.3.3  严苛的可靠性测试

新华三可靠性测试中心取得了CNASA2LAUL CTDPFCCTUV ACTVCCICCCSDPPI等数十个国内外实验室资质认证,测试报告的规范性和准确性被全球广泛认可,为产品可靠性提供有力支撑。

3.3.4  100%可靠性筛选

新华三在产品发货前均会根据产品特点进行100%可靠性筛选,采用HASS/HASAESSORT、高温老化等多种筛选方式,有效拦截生产中存在潜在缺陷的产品进入市场,降低产品早期失效率。

3.3.5  端到端可靠性数据管理

新华三建立了全流程的质量数据分析系统,可全面分析研发、生产和市场各个环节的故障情况,通过TOP问题提炼、影响度分析、失效原因分析等措施,快速改进产品,持续提升产品可靠性水平,实现端到端的可靠性数据管理。

3.4  更简便的存储运维管理

新华三分布式存储软件搭配自研硬件平台时,能够提供更细致的运维管理粒度、更丰富的运维管理功能和多种专属运维工具,进一步简化集群运维管理操作,降低运维管理成本。

3.4.1  细致的运维管理粒度

新华三分布式存储软件针对自研的硬件平台进行了深度优化和设计,能够对集群内的所有硬件资源进行更加细致地统一管理和监控。系统能够迅速地发现并及时上报硬件异常或故障,有效地简化运维流程,降低故障处理时间。

3.4.2  丰富的运维管理功能

搭配自研硬件平台时,新华三分布式存储软件拥有更丰富的运维管理功能。例如支持通过存储软件页面进行一键硬盘点灯,帮助运维人员快速定位故障硬盘在机房中的位置,从而极大降低现场运维的复杂性。

此外,新华三自研的软件与硬件配合,还支持软硬件联动智能隔离故障部件,与传统的纯软件探测方案相比速度大幅提升,能够更加迅速地隔离故障部件,进一步提升系统的稳定性和可靠性。

3.4.3  全面的硬件检查

新华三分布式存储产品提供了配套的Toolkit自动化巡检工具,可覆盖开局巡检和日常巡检场景的软硬件核心检查项,大幅简化巡检流程,降低运维操作的复杂度,避免漏检和误操作等人因差错,提高存储集群运维效率。

Toolkit针对自研硬件平台,在原有检查项的基础上额外提供了20+个硬件检查项,涵盖慢盘检测、慢IO检测等,可进一步提升集群运行的可靠性。

3.4.4  专属设备管理模块

为提升产品的可维护性、可靠性和可管理性,新华三的自研存储硬件配备了专属的SDM设备管理模块。SDM能够为CPU、硬盘、内存、存储控制卡、风扇、电源和网卡等硬件设备提供深入的健康管理功能,支持检测并上报各类设备异常,如设备故障、设备不兼容、设备寿命耗尽和设备过温等。一旦SDM检测到硬件异常,相关业务模块能够立刻感知并采取应对措施,无需等待I/O流程触发。

SDM能够屏蔽硬件差异,收集各类底层硬件信息并在存储软件的前端管理页面精准呈现,使用户能够更加便利地对集群中的硬件进行配置和管理。

新华三官网
联系我们