• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

H3C UniServer R4930 G5 H3 PKG 服务器 SAS RAID-HBA卡用户手册-6W101

手册下载

H3C UniServer R4930 G5 H3 PKG 服务器 SAS RAID-HBA卡用户手册-6W101-整本手册.pdf  (17.62 MB)

  • 发布时间:2024/3/28 3:59:05
  • 浏览量:
  • 下载量:

 

 

H3C UniServer R4930 G5 H3 PKG 服务器 SAS RAID-HBA卡用户手册

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

新华三技术有限公司

http://www.h3c.com

 

资料版本:6W101-20240322

 

 

Copyright © 2023-2024 新华三技术有限公司及其许可者 版权所有,保留一切权利。

未经本公司书面许可,任何单位和个人不得擅自摘抄、复制本书内容的部分或全部,并不得以任何形式传播。

H3C为新华三技术有限公司的商标。对于本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。

由于产品版本升级或其他原因,本手册内容有可能变更。新华三保留在没有任何通知或者提示的情况下对本手册的内容进行修改的权利。本手册仅作为使用指导,新华三尽全力在本手册中提供准确的信息,但是新华三并不确保手册内容完全没有错误,本手册中的所有陈述、信息和建议也不构成任何明示或暗示的担保。

环境保护

本产品符合关于环境保护方面的设计要求,产品的存放、使用和弃置应遵照相关国家法律、法规要求进行。


 

目录

环境保护... ii

目录... i

1       RAID卡基本概念及功能介绍... 1-1

1.1        RAID卡基本概念... 1-1

1.1.1         RAID.. 1-1

1.1.2         硬盘组... 1-1

1.1.3         虚拟硬盘... 1-1

1.2        RAID卡常用功能... 1-1

1.2.1         容错... 1-1

1.2.2         硬盘条带化... 1-2

1.2.3         校验... 1-2

1.2.4         数据重建... 1-2

1.2.5         硬盘镜像... 1-2

1.2.6         一致性校验... 1-3

1.2.7         初始化... 1-3

1.2.8         巡读... 1-4

1.2.9         外部配置... 1-4

1.2.10       热备盘... 1-5

1.2.11       紧急热备... 1-5

1.2.12       硬盘直通... 1-6

1.2.13       数据回拷... 1-6

1.2.14       硬盘状态... 1-6

1.2.15       读策略... 1-7

1.2.16       写策略... 1-7

1.2.17       掉电保护... 1-8

1.2.18       硬盘节能... 1-8

2       RAID卡、RAID-HBA卡类型及芯片技术规格... 2-1

2.1        RAID卡类型... 2-1

2.2        RAID-HBA卡类型... 2-1

2.3        RAID卡、RAID-HBA卡芯片技术规格... 2-1

3       LSI SAS3008 IT. 3-1

4       LSI SAS3108/3316 MR. 4-1

4.1        Legacy模式... 4-2

4.1.1         RAID级别及参数介绍... 4-2

4.1.2         进入RAID卡管理界面... 4-2

4.1.3         创建RAID组列... 4-7

4.1.4         删除RAID组列... 4-11

4.1.5         硬盘JBOD模式设置... 4-14

4.1.6         硬盘Unconfigured Good状态设置... 4-15

4.1.7         设置启动盘... 4-16

4.1.8         硬盘定位... 4-17

4.1.9         控制器信息查看... 4-18

4.2        UEFI模式... 4-19

4.2.1         进入BIOS将控制器设置为UEFI模式启动... 4-19

4.2.2         RAIDHII界面... 4-20

4.2.3         创建RAID组列... 4-22

4.2.4         删除RAID组列... 4-30

4.2.5         硬盘JBOD模式设置... 4-32

4.2.6         硬盘Unconfigured Good状态设置... 4-38

4.2.7         设置启动盘... 4-39

4.2.8         硬盘定位... 4-40

4.2.9         控制器信息查看... 4-43

5       LSI SAS3808/3816 IT. 5-1

5.1        进入BIOS将控制器设置为UEFI模式启动... 5-1

5.2        进入HBA卡管理界面... 5-2

5.3        控制器信息查看... 5-2

5.4        硬盘信息查看... 5-4

5.5        设置启动盘... 5-6

5.6        硬盘定位... 5-7

6       LSI SAS3908/3916 MR. 6-1

6.1        RAID级别及参数介绍... 6-1

6.2        RAIDHII界面... 6-2

6.3        创建RAID组列... 6-4

6.4        删除RAID组列... 6-10

6.5        硬盘JBOD模式设置... 6-13

6.6        硬盘Unconfigure Good状态设置... 6-16

6.7        设置启动盘... 6-18

6.8        硬盘定位... 6-20

6.9        控制器信息查看... 6-22

7       FAQ.. 7-1

7.1        LSI SAS RAID卡相关FAQ.. 7-1

7.1.1         掉盘后蜂鸣器报警相关问题... 7-1

7.1.2         RAID卡下的硬盘在系统BIOSOS下无法识别... 7-1

7.1.3         Bad or missing RAID controller memory module…报错... 7-2

7.1.4         Single-bit ECC errors were detected…报错... 7-2

7.1.5         Multibit ECC errors were detected…报错... 7-2

7.1.6         RAID卡下所连接硬盘的状态为Shield. 7-3

7.1.7         RAID组列无法完成一致性校验... 7-4

7.1.8         RAID组列降级后更换硬盘无法完成重建... 7-4

7.1.9         控制器状态显示Controller Status: Need Attention. 7-4

7.1.10       LSI SAS RAID控制器进入Safe Mode模式... 7-5

7.1.11       Your VDs that are configured for write-back…提示,写策略自动变为WT. 7-6

7.1.12       Cache data was lost due to…报错... 7-7

7.1.13       The battery hardware is missing…提示... 7-8

7.1.14       FW is in Fault State-MFI Register State 0Xf001000A报错... 7-8

7.1.15       Invalid SAS topology detected…报错... 7-9

7.1.16       重启后系统下盘符发生变化... 7-9

7.1.17       pcilib: sysfs_read_vpd: read failed: Input/output error告警... 7-10

7.1.18       使用SR02-A1061R M.2 RAID卡开机自检打印“Can't find any device”. 7-10

7.1.19       在数据回写时LSI 9361-16i RAIDPCB板上的状态灯常亮,不闪烁... 7-11

7.1.20       95系列RAID卡不支持设置JBOD.. 7-11

7.2        LSI SAS HBA卡相关FAQ.. 7-12

7.2.1         SAS Address NOT programmed on controller…报错... 7-12

7.2.2         LSI SAS卡未配置启动盘时概率进不去操作系统... 7-13

7.2.3         在系统下格式化SAS3216控制器下的希捷Haden 2.5 SATA SSD硬盘时报错... 7-14

7.2.4         mpt3sas: module verification failed: signature…告警... 7-15

7.2.5         使用SAS3008控制器IR固件组建RAID后安装VMware 6.7/7.0系统日志报错... 7-15

7.2.6         使用SAS3008控制器的HBA卡,BIOS界面下boot选项中最多只显示前24个硬盘... 7-15

8       附录... 8-1

8.1        LSI售后维护相关SOP. 8-1

8.1.1         Foreign硬盘引入... 8-1

8.1.2         RAID Volume添加热备盘(HSP) 8-5

8.1.3         在无HSP的情况下RAID掉盘后更换新硬盘方法... 8-8

8.1.4         在有HSP的情况下RAID掉盘后更换新硬盘方法... 8-10

8.2        Linux系统下LSI RAID卡工具简要操作说明... 8-12

8.2.1         控制器下拓扑结构介绍... 8-12

8.2.2         查看服务器下控制器基本信息... 8-13

8.2.3         查看各控制器详细信息... 8-14

8.2.4         查询具体某块硬盘的信息... 8-15

8.2.5         定位某块硬盘... 8-17

8.2.6         将存在隐患的硬盘强制下线... 8-18

8.2.7         查看rebuild进度... 8-19

8.2.8         更换硬盘... 8-19

8.2.9         Patrol Read相关指令与用法... 8-20

8.2.10       CC相关指令与用法... 8-24

8.3        LSI RAID卡日志搜集命令... 8-29

8.4        固件刷写操作说明... 8-35

 

 


 

插图目录

5‑1 键入“Ctrl + R”........................................................................... 13

5‑2 LSI 9361-8i RAID卡管理界面首页............................................................ 14

5‑3 LSI 9361-8i RAIDPD Mgmt界面............................................................ 15

5‑4 LSI 9361-8i RAIDCtrl Mgmt界面(1)....................................................... 16

5‑5 LSI 9361-8i RAIDCtrl Mgmt界面(2)....................................................... 16

5‑6 使用“↑↓”键将光标移至控制器一栏,键入“F2”............................................. 18

5‑7 Create Virtual Drive 页面.................................................................. 18

5‑8 RAID Level选择界面........................................................................ 19

5‑9 选择RAID组列的成员硬盘.................................................................... 19

5‑10 RAID成员盘选择完成....................................................................... 20

5‑11 设置读写策略.............................................................................. 20

5‑12 Write Policy设置......................................................................... 21

5‑13 选择“OK”完成RAID组建................................................................... 21

5‑14 没有对组建RAID进行初始化弹出的提示信息................................................... 21

5‑15 RAID1组建完成............................................................................ 22

5‑16 选择“Delete VD”......................................................................... 23

5‑17 弹出提示信息,选择“YES”确认删除......................................................... 23

5‑18 选择“Delete Drive Group”................................................................ 24

5‑19 弹出提示删除信息.......................................................................... 24

5‑20 选择“Clear Configuration”............................................................... 25

5‑21 弹出提示信息.............................................................................. 25

5‑22 勾选Enable JBOD选项...................................................................... 26

5‑23 JBOD设置成功............................................................................. 26

5‑24 进入“PD Mgmt”页面....................................................................... 27

5‑25 转换为unconfigured good状态.............................................................. 27

5‑26 进入“Ctrl Mgmt”页面设置启动盘........................................................... 28

5‑27 选择想要定位的硬盘........................................................................ 28

5‑28 定位硬盘.................................................................................. 29

5‑29 硬盘定位结束.............................................................................. 29

5‑30 进入“Properties”页面.................................................................... 30

5‑31 进入第二页................................................................................ 30

5‑32 进入PCIe Devices List.................................................................... 31

5‑33 SAS3108 Option ROM设置为UEFI.......................................................... 31

5‑34 选择进入LSI 9361-8i HII管理界面.......................................................... 32

5‑35 LSI 9361-8i HII管理界面.................................................................. 32

5‑36 “Main Menu”界面......................................................................... 33

5‑37 进入配置界面.............................................................................. 34

5‑38 “Create Virtual Drive”.................................................................. 34

5‑39 RAID创建前硬盘设置....................................................................... 35

5‑40 RAID组列参数配置......................................................................... 36

5‑41 “Select RAID Level”..................................................................... 38

5‑42 “Select Drives”......................................................................... 38

5‑43 “Virtual Drive Name”设置................................................................ 39

5‑44 “Strip Size”设置........................................................................ 39

5‑45 设置读策略................................................................................ 40

5‑46 设置写策略................................................................................ 40

5‑47 确认RAID组建............................................................................. 40

5‑48 选择“OK”完成RAID组建................................................................... 41

5‑49 进入“Main Menu”......................................................................... 41

5‑50 选择“Virtual Drive Management”.......................................................... 41

5‑51 选择要删除的RAID组列..................................................................... 42

5‑52 “Delete Virtual Drive”功能选择.......................................................... 42

5‑53 开始删除组列.............................................................................. 42

5‑54 确认删除RAID组列......................................................................... 43

5‑55 组列删除完成.............................................................................. 43

5‑56 选择Main Menu............................................................................ 43

5‑57 选择Controller Management................................................................ 44

5‑58 选择Advanced Controller Properties....................................................... 44

5‑59 选择Enable............................................................................... 45

5‑60 进入配置界面.............................................................................. 46

5‑61 选择“Make JBOD”......................................................................... 46

5‑62 JBOD盘选择............................................................................... 47

5‑63 确认进行JBOD设置......................................................................... 47

5‑64 JBOD设置完成............................................................................. 47

5‑65 进入“View Server Profile”............................................................... 48

5‑66 进入“Drive Management”.................................................................. 48

5‑67 控制器下各硬盘状态........................................................................ 48

5‑68 进入配置界面.............................................................................. 49

5‑69 进入“Make Unconfigure Good”界面......................................................... 49

5‑70 选择要转换为Unconfigure Good状态的硬盘................................................... 50

5‑71 确认进行Unconfigured Good状态设置........................................................ 50

5‑72 Unconfigured Good状态设置完成............................................................ 50

5‑73 进入“Main Menu”......................................................................... 51

5‑74 进入“Controller Management”............................................................. 51

5‑75“Select Boot Device”界面................................................................. 51

5‑76 进入LSI 9361-8i HBA卡管理界面............................................................ 52

5‑77 LSI 9361-8i HBA卡管理界面................................................................ 52

5‑78 LSI 9361-8i HBA“Main Menu”界面....................................................... 53

5‑79 LSI 9361-8i HBA“Drive Management”界面................................................ 53

5‑80 LSI 9361-8i HBA卡选择进行“Start Locate”................................................ 53

5‑81 LSI 9361-8i HBA卡硬盘定位................................................................ 54

5‑82 进入“Controller Management”控制器管理界面............................................... 54

5‑83 Controller Management界面................................................................ 55

9‑1进入PCIe Devices List...................................................................... 56

9‑2SAS3808 Option ROM设置为UEFI........................................................... 56

9‑3进入LSI 9500-8i HBA卡管理界面............................................................. 57

9‑4 LSI 9500-8i HBA卡管理界面................................................................. 57

9‑5进入LSI 9500-8i HBA卡管理界面............................................................. 58

9‑6 LSI 9500-8i HBA卡管理界面................................................................. 58

9‑7 LSI 9500-8i HBA“Controller Properties”界面............................................ 58

9‑8进入LSI 9500-8i HBA卡管理界面............................................................. 59

9‑9 LSI 9500-8i HBA卡管理界面................................................................. 59

9‑10 LSI 9500-8i HBA“Device Properties”界面............................................... 59

9‑11 LSI 9500-8i HBA“Enclosure (Enclosure Level=0)”界面................................... 60

9‑12 LSI 9500-8i HBA卡硬盘信息查看............................................................ 60

9‑13进入LSI 9500-8i HBA卡管理界面............................................................ 61

9‑14 LSI 9500-8i HBA卡管理界面................................................................ 61

9‑15 LSI 9500-8i HBA“Device Properties”界面............................................... 61

9‑16 LSI 9500-8i HBA“Enclosure (Enclosure Level=0)”界面................................... 62

9‑17 LSI 9500-8i HBA卡启动盘设置.............................................................. 62

9‑18进入LSI 9500-8i HBA卡管理界面............................................................ 63

9‑19 LSI 9500-8i HBA卡管理界面................................................................ 63

9‑20 LSI 9500-8i HBA“Device Properties”界面............................................... 63

9‑21 LSI 9500-8i HBA“Enclosure (Enclosure Level=0)”界面................................... 63

9‑22 LSI 9500-8i HBA卡定位.................................................................... 64

10‑1 进入PCIe Devices List.................................................................... 65

10‑2 SAS3908 Option ROM设置为UEFI.......................................................... 65

10‑3 选择进入9560-8i HII界面.................................................................. 66

10‑4 HII主界面................................................................................ 66

10‑5 “Main Menu”界面......................................................................... 67

10‑6 进入配置界面.............................................................................. 67

10‑7 “Create Virtual Drive”.................................................................. 68

10‑8 RAID组列创建前硬盘设置................................................................... 68

10‑9 RAID组列参数配置......................................................................... 69

10‑10 “Select RAID Level”.................................................................... 71

10‑11 “Select Drives”........................................................................ 71

10‑12 “Virtual Drive Name”设置............................................................... 72

10‑13 “Strip Size”设置....................................................................... 72

10‑14 设置读策略............................................................................... 72

10‑15 设置写策略............................................................................... 73

10‑16 确认RAID组建............................................................................ 73

10‑17 选择“OK”完成RAID组建.................................................................. 73

10‑18 进入“Main Menu”........................................................................ 74

10‑19 选择“Virtual Drive Management”......................................................... 74

10‑20 选择要删除的RAID组列.................................................................... 74

10‑21 “Delete Virtual Drive”功能选择......................................................... 75

10‑22 开始删除组列............................................................................. 75

10‑23 确认删除RAID组列........................................................................ 75

10‑24 组列删除完成............................................................................. 76

10‑25 进入配置界面............................................................................. 76

10‑26 选择“Make JBOD”........................................................................ 76

10‑27 JBOD盘选择.............................................................................. 77

10‑28 确认JBOD设置............................................................................ 77

10‑29 JBOD设置完成............................................................................ 77

10‑30 进入“View Server Profile”.............................................................. 78

10‑31 进入“Drive Management”................................................................. 78

10‑32 查看控制器下各硬盘状态................................................................... 79

10‑33 进入配置界面............................................................................. 79

10‑34 进入“Make Unconfigure Good”............................................................ 80

10‑35 硬盘选择界面............................................................................. 80

10‑36 确认进行Unconfigured Good状态设置....................................................... 81

10‑37 Unconfigured Good状态设置完成........................................................... 81

10‑38 进入“Main Menu”........................................................................ 82

10‑39 进入“Controller Management”............................................................ 82

10‑40 “Select Boot Device”................................................................... 82

10‑41 进入“Main Menu”........................................................................ 83

10‑42 选择进入“Drive Management”............................................................. 83

10‑43 LSI 9560-8i “Drive Management”界面..................................................... 84

10‑44 LSI 9560-8i选择进行“Start Locate”..................................................... 84

10‑45 LSI 9560-8i硬盘定位..................................................................... 85

10‑46 进入“Controller Management”控制器管理界面.............................................. 85

10‑47 Controller Management界面............................................................... 86

12‑1 Bad or Missing RAID controller memory module…报错........................................ 87

12‑2 Single-bit ECC errors were detected…报错................................................. 88

12‑3 Multibit ECC errors were detected…报错................................................... 88

12‑4 硬盘状态显示为“Shield”.................................................................. 89

12‑5 Controller StatusNeed Attention......................................................... 90

12‑6 Controller is running in safe mode........................................................ 91

12‑7 Your VDs that are configured for…提示.................................................... 92

12‑8 RAID卡日志中的提示....................................................................... 92

12‑9 Cache data was lost due to…报错.......................................................... 93

12‑10 The battery hardware is missing…提示.................................................... 93

12‑11 “FW is in Fault State…Adapter at Baseport is not responding”报错...................... 94

12‑12 Invalid SAS topology detected…报错...................................................... 95

12‑13 系统下出现盘符乱序....................................................................... 95

12‑14 pcilib: sysfs_read_vpd: read failed: Input/output error告警............................. 96

12‑15 Can't find any device告警................................................................ 96

12‑16 Controller does not support JBOD告警..................................................... 97

12‑17 SAS Address NOT programmed on controller…报错........................................... 98

12‑18 SAS AddressPCB上位置示例............................................................. 98

12‑19 键入Alt+B将具体硬盘设置为Boot........................................................ 99

12‑20 设置可启动设备数量....................................................................... 99

12‑21 mpt3sas: module verification failed告警................................................ 101

12‑22 Failed to rescan SCSI adapter Invalid, Invalid name告警................................ 101

13‑1 进入Configuration Utility界面........................................................... 102

13‑2 Configuration Utility界面............................................................... 102

13‑3 标识为“FOREIGN”开头的硬盘查看.......................................................... 103

13‑4 Import操作(1)........................................................................... 103

13‑5 Import操作(2)........................................................................... 104

13‑6 Import操作(3)........................................................................... 104

13‑7 Clear操作............................................................................... 105

13‑8 Clear完成后硬盘将自动变为Uncofigure Good状态........................................... 105

13‑9 硬盘状态显示为UB........................................................................ 106

13‑10 “UB”状态切换为“Foreign”............................................................. 106

13‑11 选择想要作为全局热备盘的硬盘............................................................ 107

13‑12 “Make Global HS”选项.................................................................. 107

13‑13 设置全局热备盘.......................................................................... 108

13‑14 “Manage Ded. HS”选项.................................................................. 108

13‑15 选择想要作为热备盘的硬盘................................................................ 109

13‑16 查看创建结果............................................................................ 109

13‑17 查看告警RAID组列....................................................................... 110

13‑18 硬盘开始进行Rebuild.................................................................... 110

13‑19 Rebuild完成后组列RAID状态............................................................. 111

13‑20 COPYBACK功能选择....................................................................... 112

13‑21 选择目标硬盘............................................................................ 112

13‑22 开始COPYBAK............................................................................ 113

13‑23 控制器下管理结构........................................................................ 114

13‑24 查看控制器基本信息...................................................................... 115

13‑25 查看控制器详细信息(1)................................................................... 115

13‑26 查看控制器详细信息(2)................................................................... 116

13‑27 查看控制器详细信息(3)................................................................... 116

13‑28 控制器下拓扑结构........................................................................ 117

13‑29 查询具体某块硬盘的信息(1............................................................. 117

13‑30 查询具体某块硬盘的信息(2............................................................. 118

13‑31 定位某块硬盘............................................................................ 119

13‑32 将存在隐患的硬盘强制下线(1........................................................... 119

13‑33 将存在隐患的硬盘强制下线(2........................................................... 119

13‑34 将存在隐患的硬盘强制下线(3........................................................... 120

13‑35 查看rebuild进度........................................................................ 120

13‑36 手动将之前恢复占用的热备盘中的数据回写到替换后的新盘.................................... 121

13‑37 查看回写进度的命令...................................................................... 121

13‑38 查看控制器预读信息...................................................................... 122

13‑39 关闭预读功能............................................................................ 122

13‑40 打开预读并设置模式为手动................................................................ 123

13‑41 设置预读执行间隔,单位为小时............................................................ 123

13‑42 开始预读................................................................................ 123

13‑43 暂停预读................................................................................ 124

13‑44 恢复已暂停预读.......................................................................... 124

13‑45 停止预读................................................................................ 124

13‑46 设置预读占用RAID控制器资源比率......................................................... 125

13‑47 查看预读占用RAID控制器资源比率......................................................... 125

13‑48 查看CC的具体信息....................................................................... 126

13‑49 CC功能关闭........................................................................... 127

13‑50 CC设置为并发模式..................................................................... 127

13‑51 设置CC占用RAID控制器资源比率.......................................................... 127

13‑52 查看CC占用RAID控制器资源比率.......................................................... 128

13‑53 开始CC................................................................................. 128

13‑54 开始完全初始化.......................................................................... 128

13‑55 查看完全初始化进度...................................................................... 129

13‑56 暂停CC................................................................................. 129

13‑57 恢复暂停的CC........................................................................... 129

13‑58 停止CC................................................................................. 129

13‑59 查看CC的具体状态....................................................................... 130

13‑60 查看控制器的详细信息.................................................................... 130

13‑61 查看背板的详细信息...................................................................... 131

13‑62 查看RAID组列的详细信息................................................................. 132

13‑63 查看RAIDFirmwareTermLog............................................................. 132

13‑64 查看RAIDalilog...................................................................... 133

13‑65 查看RAIDalilog...................................................................... 133

13‑66 查看RAID卡下有无Snapdump日志.......................................................... 134

13‑67 查看控制器端Phyerrorcounter(1)......................................................... 134

13‑68 查看控制器端Phyerrorcounter(2)......................................................... 135

13‑69 SAS接口硬盘phyerrorcounter............................................................. 135

13‑70 SATA接口硬盘phyerrorcounter............................................................ 136

13‑71 Linux下刷新FW数据包................................................................... 136

13‑72 进入Built-in EFI Shell................................................................. 137

13‑73进入Firmware所在路径................................................................... 137

 


 

表格目录

1‑1 HBA卡硬盘状态表............................................................................ 6

1‑2 RAID卡硬盘状态表........................................................................... 7

2‑1 RAID-HBA卡类型及基本信息................................................................... 9

2‑2 RAID-HBA卡芯片技术规格.................................................................... 10

2‑3 RAID-HBA卡芯片技术规格.................................................................... 11

5‑1 LSI 9361-8i RAID卡级别介绍................................................................ 13

5‑2 LSI 9361-8i RAID卡管理子界面功能说明表.................................................... 14

5‑3 LSI 9361-8i RAID PD Mgmt界面参数说明表.................................................. 15

5‑4 LSI 9361-8i RAID Ctrl Mgmt界面参数说明表................................................ 17

5‑5 LSI 9361-8i RAID“Properties”界面参数说明表............................................ 30

5‑6 LSI 9361-8i RAIDHII界面参数说明表...................................................... 33

5‑7 LSI 9361-8i RAIDMain Menu界面参数说明表................................................ 33

5‑8 LSI 9361-8i RAIDRAID创建RAID组列前硬盘设置界面参数说明表.............................. 35

5‑9 LSI 9361-8i RAID组列参数配置界面说明表.................................................... 36

5‑10 LSI 9361-8i RAID“Controller Management”控制器管理界面参数说明表...................... 55

9‑1 LSI 9500-8i HBA卡管理界面参数说明表....................................................... 57

9‑2 LSI 9500-8i HBA“Controller Properties”界面参数说明表.................................. 58

9‑3 LSI 9500-8i HBA卡硬盘信息查看界面参数说明表............................................... 60

10‑1 LSI 9560-8i RAID级别介绍................................................................. 64

10‑2 LSI 9560-8i RAIDHII主界面参数说明表................................................... 66

10‑3 LSI 9560-8i RAIDMain Menu界面参数说明表............................................... 67

10‑4 LSI 9560-8i RAID组列创建前硬盘设置界面参数说明表......................................... 68

10‑5 LSI 9560-8i RAID组列参数设置界面说明表................................................... 69

10‑6 LSI 9560-8i RAID“Controller Management”界面参数说明表................................ 86

12‑1 LSI RAID卡蜂鸣器报警状态说明表........................................................... 87

 


1     RAID卡基本概念及功能介绍

1.1     RAID卡基本概念

1.1.1     RAID

RAID(Redundant Arrays of Independent Disks),意为“独立硬盘构成的具有冗余能力的阵列”,是由多个独立硬盘、按照一定策略组建成的新的存储介质或阵列。

在存储技术还未普及时,大容量硬盘比较昂贵,为了以较低的成本获得与昂贵大容量硬盘相当的容量、性能、可靠性,将多个容量较小、相对廉价的硬盘进行有机组合的RAID技术应运而生。随着整个社会信息化水平的不断提高,各行各业有对数据处理、存储能力提出了越来越高的要求,进一步推动了 RAID技术的发展。

如今,通过RAID技术,我们可以获得更大的存储空间、更快的传输速度和更高的安全性。

1.1.2     硬盘组

硬盘组(Drive Group,简称“DG”)即一组物理硬盘组成的集合。

1.1.3     虚拟硬盘

虚拟硬盘(Virtual Drive,简称“VD”)也可称为RAID组列,是在硬盘组的基础上划分出的一组连续的存储单元,对于操作系统而言,相当于一个物理硬盘。该存储单元因使用的RAID技术不同,而具有不同的硬盘利用率、容错能力、读写性能和冗余度。

一个虚拟硬盘可以由一个硬盘组构成,也可以由一个硬盘组的一部分构成。

1.2     RAID卡常用功能

1.2.1     容错

容错(Fault Tolerance)是指当硬盘组中一个或多个硬盘出现故障时,仍然可以正常进行数据处理、保障硬盘组数据的完整性不被破坏的能力。

1.2.2     硬盘条带化

硬盘条带化(Disk Striping)是指将一块连续的数据分成很多规定大小的数据块,并把它们分别存储到不同硬盘上的方法,这些硬盘会根据数据块的大小将存储空间划分出一个个大小相同的空间(条带),用于存放数据。由于数据存放在不同的硬盘上,那么在顺序访问这些数据的时候,就可以同时从多个不同的硬盘按照并行的方式获取数据,大大提高了I/O性能。

Ÿ     硬盘条带大小:指每个硬盘划分出的,用于存放数据的单位空间的大小;

Ÿ     条带宽度:指硬盘组中硬盘的数量;

Ÿ     硬盘组条带大小:硬盘条带大小与条带宽度的乘积。

1.2.3     校验

校验(Parity)指的是从两个或多个父数据集生成一组冗余数据。当发生硬盘故障时,冗余数据可用于重建父数据集。奇偶校验数据不是完全复制父数据集。

奇偶校验数据的计算、生成会减慢数据写入过程。

1.2.4     数据重建

数据重建(Data Rebuild)即当RAID组列中的硬盘发生故障或者一致性校验发现数据错误时,可以通过重新创建硬盘中之前的数据或者对数据进行修正的方式,对硬盘进行重建。

RAID控制器使用存储在RAID组列中其他硬盘上的数据(或校验位)重建数据。

只有具有数据冗余能力的RAID组列才能执行重建,其中包括RAID 156105060

1.2.5     硬盘镜像

硬盘镜像(Disk Mirroring)指的是将数据写入一个硬盘的同时,控制器会把数据复制到另一块硬盘。

硬盘镜像的主要优点是提供了100%的数据冗余。由于数据写入到了两块盘中,即使一块盘发生故障,数据也不会丢失,另一块盘仍然可以供系统使用,并且在换上新的硬盘之后控制器还可以进行数据重建,恢复冗余能力。

1.2.6     一致性校验

一致性校验(Consistency Check)是验证具有冗余能力的RAID组列(RAID1/5/6/10/50/60)中条带上的数据是否一致,如果不一致会尝试自动对错误进行修复或标记的操作。该过程中RAID控制器会对成员盘中的数据进行检查和计算,生成新的奇偶校验数据与校验盘中的数据进行比对,若出现不一致,则会使用新的奇偶校验数据修正错误数据。

对于RAID 1组列,此操作将验证每个条带的镜像数据是否一致。

建议至少一个月进行一次一致性校验。

1.2.7     初始化

初始化(Initialization)是为了保证硬盘数据的一致性而进行的操作。初始化会将零写入RAID组列中,以将RAID组列置于“就绪”状态的过程。具有容错能力的RAID组列在初始化时还会生成相应的奇偶校验。

初始化会擦除驱动器上的所有先前数据。

虽然RAID组列无需初始化也可以工作,但由于无法保证硬盘中数据的正确性、尚未生成奇偶校验字段,它们可能无法通过一致性检查。所以RAID组列必须经过初始化才可以使用。

初始化可分为前台初始化和后台初始化。

1.2.7.1     前台初始化

前台初始化分为两种:快速初始化(Fast)和全部初始化(Full)

Ÿ     快速初始化:控制器只需将硬盘组的前100M(根据控制器不同大小可能会有差异)空间写零,就结束了初始化过程,用户可以快速使用硬盘组。

Ÿ     全部初始化:控制器需要将硬盘组的全部空间写零,才会结束初始化过程。该初始化模式耗费时间较长,用户需要等待初始化结束可以使用硬盘组。

1.2.7.2     后台初始化

后台初始化会在创建RAID组列后对成员盘进行检查,排查出硬盘错误、保证数据正确性。后台初始化会在RAID组列创建完成5分钟(不同固件版本可能存在差异)后自动进行。

后台初始化的目的是使具有冗余能力的RAID组列中各成员盘的数据满足RAID组列的级别要求:

Ÿ     对于RAID110,后台初始化过程中如果发现主从成员盘的数据不一致,就会将主成员盘的数据复制到次成员盘中,覆盖不一致的数据;

Ÿ     对于RAID565060,后台初始化会对成员盘中条带的数据进行奇偶校验,如果发现新的校验位和组列中现存的校验数据不一致,就会使用新的校验数据替换掉旧数据。

后台初始化和一致性检验的功能类似,两者区别在于后台初始化是创建RAID组列后强制进行的操作,而一致性校验不是。

后台初始化时要求RAID56级别的RAID组列满足最小成员盘数量,如果不能满足最小成员盘数量要求,后台初始化不会进行,需要手动进行。

Ÿ     RAID1级别的RAID组列要求至少有2块成员盘,才可进行后台初始化;

Ÿ     RAID5级别的RAID组列要求至少有5块成员盘,才可进行后台初始化;

Ÿ     RAID6级别的RAID组列要求至少有7块成员盘,才可进行后台初始化;

1.2.8     巡读

巡读(Patrol Read)功能指的是通过对控制器下的硬盘进行巡回检查,以发现可能导致硬盘故障的潜在错误,然后采取措施纠正错误。巡读的目的是在数据损坏之前检测出硬盘故障,从而保护硬盘上数据的完整性。

发现错误后采取何种纠正措施取决于RAID组列的配置和出现的错误类型。

巡读操作仅在控制器闲置了一段规定的时间后,并且没有其他后台任务执行时才会开始。

1.2.9     外部配置

当插入服务器的硬盘带有RAID配置信息时(之前在其他RAID控制器上被配置为某一RAID组列的成员盘),MegaRAID Storage Manager软件将会把硬盘状态识别为外部配置(Foreign Configuration,以提醒用户该硬盘带有之前的RAID配置信息,无法直接使用。

这种情况下,用户可以将硬盘中带有的配置重新导入(ImportRAID控制器,实现RAID组列的迁移,或者可以清除配置,以便创建新的配置。

1.2.10     热备盘

热备盘(Hot Spares)是控制器系统下额外保留的、未使用的硬盘。它通常处于待机模式,如果RAID组列中的成员盘发生故障,热备盘无需系统重启或用户干预即可自动更换故障盘MegaRAID SAS RAID控制器可以使用热备用驱动器实现故障驱动器的自动重建,从而提供高度的容错能力和零停机时间。

热备盘只对具有冗余能力的RAID组列生效:RAID156105060

RAID控制器支持如下两种热备盘:

Ÿ     局部热备盘(专用热备盘):局部热备盘只能为一个或多个特定的RAID组列服务,如果其他组列出现故障盘,局部热备盘不会进行自动更换;

Ÿ     全局热备盘:全局热备盘可以为RAID控制器下的所有RAID组列服务,当任何一个RAID组列出现成员盘故障时,全局热备盘都会自动顶替故障盘。

注意:设置热备盘时,其容量要等于或大于故障盘。

1.2.11     紧急热备

与需要单独设置热备盘不同,紧急热备(Emergency Spare)策略允许RAID控制器在没有热备盘的情况下,当RAID组列出现故障盘时,使用空闲的Unconfigured Good状态硬盘作为故障盘的替代盘,自动对RAID组列进行补充,从而保证控制器下RAID组列的正常使用。

紧急热备要求用于备份的硬盘容量等于或大于故障盘,且只对具有冗余能力的RAID组列生效:RAID156105060

1.2.12     硬盘直通

硬盘直通(JBOD)又称指令透传,是指插在RAID卡上的物理硬盘在不配置虚拟硬盘的情况下,用户指令可以直接透传到硬盘、直接被操作系统识别、管理,而不经过RAID控制器处理。

因为不受RAID控制器控制,所以直通硬盘无法组建RAID组列,但硬盘直通可以保证数据传输的稳定性,进而提高数据的安全性和传输性能,。

1.2.13     数据回拷

对于由冗余功能的RAID组列(RAID 156105060),出现故障盘后,控制器会自动将数据重建至热备盘。当把故障盘换下、插上新的健康硬盘后,控制器会把重建好的热备盘数据回拷(Copyback)至健康硬盘中。回拷完成后,热备盘将自动恢复为热备状态。

1.2.14     硬盘状态

硬盘状态反映了硬盘当前的工作模式、硬盘功能、正在进行何种操作等信息。

1-1描述了HBA卡下硬盘的状态:

11 HBA卡硬盘状态表

状态

含义

Online

控制器正在使用的硬盘,是现有RAID组列中的成员。

Hot Spare

热备盘。该硬盘已经上电,并且准备在RAID组列中出现故障盘时,随时顶替故障盘。

Ready

准备状态,该状态的硬盘可以用作RAID组列成员盘,也可以分配为热备盘。

该状态的硬盘无法直接被操作系统发现、使用。

Available

该硬盘可能尚未准备好,因此不适合作为RAID成员盘或热备盘使用。

Failed

之前状态为“Online”或“Hot Spare”的硬盘,被固件检查出存在不可恢复的错误后,将变为Failed状态。

Missing

该硬盘被移除或处于未响应状态。

Standby

该设备不是硬盘设备。

Out of Sync

该硬盘为IR RAID组列的成员盘,但是和该RAID组列其他成员盘的数据不同步。

Degraded

该硬盘是RAID组列的一部分,且目前处于降级状态。

Rebuilding

硬盘正在进行数据重建。

Optimal

该硬盘为RAID组列成员盘,且状态良好。

12 RAID卡硬盘状态表

状态

含义

Online

控制器正在使用的硬盘,是现有RAID组列中的成员。

Unconfigured Good

未被配置的良好状态,该状态的硬盘可以用作RAID组列成员盘,也可以分配为热备盘。该状态的硬盘无法直接被操作系统发现、使用。

Ready

该硬盘可以用作RAID组列成员盘,也可以分配为热备盘。

Hot Spare

热备盘。该硬盘已经上电,并且准备在RAID组列中出现故障盘时,随时顶替故障盘。

Failed

之前状态为“Online”或“Hot Spare”的硬盘,被固件检查出存在不可恢复的错误后,将变为Failed状态。

Rebuild

硬盘正在进行数据重建,为了恢复RAID组列的冗余能力。

Unconfigured Bad

硬盘处在Unconfigured Good状态或未被初始化状态时,被固件检查出存在不可修复的错误,将会变为Unconfigured Bad状态。

Missing

丢失。RAID组列中的硬盘被拔出后将处于丢失状态。

Offline

离线。该盘之前为RAID组列成员盘,现在处于离线状态,不可使用。

Shield State

临界状态。此时硬盘正在进行诊断操作。

Copyback

当硬盘正在替换RAID组列中Failed状态的硬盘时,会处于该状态。

JBOD

直通硬盘。不受RAID控制器的控制,可直接被上层操作系统发现、使用。

1.2.15     读策略

RAID组列的读策略有两种:

Ÿ     No Read Ahead:关闭预读取功能;

Ÿ     Read Ahead:开启预读取功能。在读取所请求的数据外,控制器会将请求数据所在地址之后的部分数据也读入到Cache中,以期望这些数据随后被系统使用时可以直接在Cache中命中,从而增快响应速度、提高读性能。

1.2.16     写策略

RAID组列的写策略(Write Policy)有三种:

Ÿ     Always Write Back:一直使用写回策略。无论是否存在超级电容,RAID组列都将使用写回策略进行数据写入。写回策略是指,控制器在将请求写入的数据写入Cache后,就向上层软件反馈写操作完成,可RAID控制器不会马上将数据写至硬盘,而是等到Cache写满后,才将这些数据一起写入指硬盘。如果控制器没有搭配超级电容时出现异常掉电,可能会使写入Cache中的数据还未写入至硬盘,就因掉电而丢失;

Ÿ     Write Through:控制器在将请求写入的数据写入至硬盘后,才向上层软件反馈写操作完成;

Ÿ     Write Back:条件使用写回策略。与Always Write Back不同,Write Back策略在控制器使用超级电容时,会一直开启写回功能,而当检测到没有超级电容、电容正在充放电或电容损坏时,会自动切换至Write Through策略,从而保证数据不被丢失

1.2.17     掉电保护

当控制器搭配超级电容时,如果遇到异常掉电的情形,超级电容模块会利用电容中存储的电量,将Cache中的数据写入至模块中的Nand Flash中进行保存,等到控制器下次上电时,再将存储在Nand Flash中的数据写回Cache,进而保证数据不会因掉电而丢失。

1.2.18     硬盘节能

RAID控制器具有硬盘节能的功能。当该功能开启时,控制器下Unconfigured Good状态的硬盘、热备盘都将处于节能状态。控制器允许节能状态下的硬盘暂时停转,当出现需要使用这些硬盘的操作时(如RAID组建、RAID组列出现故障盘等),将硬盘从节能状态唤醒。

硬盘节能状态适用于所有旋转式SASSATA硬盘。

 


2     RAID卡、RAID-HBA卡类型及芯片技术规格

2.1     RAID卡类型

RAID卡的类型及基本信息如表2-1所示。

21 RAID卡类型及基本信息

PKG RAID卡描述

对应型号

芯片型号

BCM 9560 -E4x8 8i SE 4GB Tri-Mode RAID

9560-8i(4G)

SAS3908

BCM 9560 -E4x8 16i SE 8GB Tri-Mode RAID

9560-16i(8G)

SAS3916

BCM 9500 -E4x8 8i SE Tri-Mode HBA

9500-8i

SAS3808

BCM 9500 -E4x8 16i SE Tri-Mode HBA

9500-16i

SAS3816

LSI 9361-16i -E3x8 SE 2GB SAS 12G RAID

9361-16i

SAS3316

SH08-L3008 -E3x8 8i SE SAS 12Gb HBA

9311-8i

SAS3008

SH08-L3008 -E3x8 8i SE SAS 12Gb HBA(IR)

9311-8i

SAS3008

SH08-L3008 -E3x8 SE SAS 12Gb HBA(IR)-B

9311-8i

SAS3008

2.2     RAID-HBA卡类型

RAID-HBA卡的类型及基本信息如表2-2所示。

22 RAID-HBA卡类型及基本信息

物料描述

厂商

芯片

固件类型

芯片厂商

LSI 9361-16i -E3x8 SE 2GB SAS 12G RAID

Broadcom

SAS3316

MR

Broadcom

BCM 9500-8i -E4x8 8i Tri-Mode HBA

Broadcom

SAS3808

IT

Broadcom

BCM 9500-16i -E4x8 16i Tri-Mode HBA

Broadcom

SAS3816

IT

Broadcom

BCM 9560-8i -E4x8 8i Tri-Mode RAID

Broadcom

SAS3908

MR

Broadcom

BCM 9560-8i -E4x8 16i Tri-Mode RAID

Broadcom

SAS3916

MR

Broadcom

SH08-L3008 -E3x8 8i SE SAS 12Gb HBA

Broadcom

SAS3008

IT

Broadcom

2.3     RAID卡、RAID-HBA卡芯片技术规格

SAS3108SAS3316SAS3908 SAS3916芯片的技术规格如表2-3所示,其他芯片的技术规格如表2-4所示。

23 RAID卡、RAID-HBA卡芯片技术规格

技术规格

SAS

3108

SAS

3316

SAS

3908

SAS

3916

存储端SAS接口速率(Gb/s)

12

12

12

12

存储端PCIe接口速率(GT/s)(备注1

NA

NA

16

16

是否支持硬盘直通/JBOD

支持的最大硬盘数

240

16/240(备注1)

240

240

是否支持Upgrade Key

支持的RAID级别

0/1/5/6/10/50/60

0/1/10/5/6/50/60(备注1)

0/1/5/6/10/50/60

0/1/5/6/10/50/60

支持的RAID组列最大数量

64

64

64

64

单个RAID组支持的最大硬盘数量

240

16/240(备注1)

240

240

所有RAID组支持的最大硬盘数量

240

16/240(备注1)

240

240

支持的条带大小

64KB/128KB/256KB/512KB/1MB

64KB/128KB/256KB/512KB/1MB

64KB/128KB/256KB/512KB/1MB

64KB/128KB/256KB/512KB/1MB

是否支持局部热备

是否支持全局热备

是否支持紧急热备

支持的热备盘数量

240

16/240(备注1)

240

240

是否支持超级电容

是否支持巡读

是否支持一致性校验

是否支持带外管理

是否支持NVMe硬盘

支持NVMe硬盘数量

NA

NA

32

32

是否支持UBM协议

Cache大小

1/2GB

4GB

4GB

8GB

24 RAID卡、RAID-HBA卡芯片技术规格

技术规格

SAS

3008

SAS

3808

SAS

3816

存储端SAS接口速率(Gb/s)

12

12

12

 

存储端PCIe接口速率(GT/s)

8

16

16

 

是否支持硬盘直通/JBOD

 

支持的最大硬盘数

1024

1024

1024

 

是否支持Upgrade Key

 

支持的RAID级别

0/1/10/1E

NA

NA

 

支持的RAID组列最大数量

14

NA

NA

 

单个RAID组支持的最大硬盘数量

10

NA

NA

 

所有RAID组支持的最大硬盘数量

10

NA

NA

 

支持的条带大小

NA

NA

NA

 

是否支持局部热备

 

是否支持全局热备

 

是否支持紧急热备

 

支持的热备盘数量

2

NA

NA

 

是否支持超级电容

 

是否支持巡读

 

是否支持一致性校验

 

是否支持带外管理

 

是否支持NVMe硬盘

 

支持NVMe硬盘数量

NA

32

32

 

是否支持UBM协议

 

Cache大小

NA

NA

NA

 

 


3     LSI SAS3008 IT

公司目前在用的是基于LSI SAS3008芯片的HBA卡为LSI 9300-8i HBA卡。SAS3008支持UEFILegacy两种模式。

该卡的使用方法,请参见存储控制卡用户指南的“HBA-LSI-9300-8i-A1-X”章节。

4     LSI SAS3108/3316 MR

公司目前在用的基于LSI SAS3108芯片的RAID卡为LSI 9361-8i RAID卡,基于LSI SAS3316 芯片的RAID卡包括LSI 9361-16iSR16-L3316

LSI SAS3108/3316 MR芯片对应的RAID卡可以使用LegacyUEFI两种模式。Legacy模式下的管理界面为Config Utility界面(下文简称为CU界面),UEFI模式下的管理界面为Human Interface Infrastructure界面(下文简称为HII界面)。

下面以LSI 9361-8i为例介绍LSI SAS3108/3316 MR芯片RAID卡的操作方法,所述内容同样适用于LSI 9361-16iSR16-L3316 RAID卡。

4.1     Legacy模式

4.1.1     RAID级别及参数介绍

LSI 9361-8i支持的RAID级别及相关参数如下表所示。

51 LSI 9361-8i RAID卡级别介绍

RAID级别

成员盘数量

子组数量

子组硬盘数量

允许最大坏盘数

RAID 0

1~32

NA

NA

0

RAID 1

2~32(偶数)

NA

NA

硬盘数÷2

RAID 5

3~32

NA

NA

1

RAID 6

3~32

NA

NA

2

RAID 10

4~240(偶数)

2~8

2~32

子组数

RAID 50

6~240

2~8

3~32

子组数

RAID 60

6~240

2~8

3~32

子组数*2

Ÿ 子组数表示了RAID 10/50/60组列中包含的RAID1/5/6子组列的数量,如:两组RAID1组成的RAID10组列,子组数为2

Ÿ RAID 1/10需使用偶数块成员盘

4.1.2     进入RAID卡管理界面

启动系统,在POST界面出现如下提示信息时,键入“Ctrl + R”进入RAID卡管理界面:

51 键入“Ctrl + R”

LSI 9361-8i管理界面首页如下图:

 

52 LSI 9361-8i RAID卡管理界面首页

VD Mgmt子界面

LSI 9361-8i界面首页显示的内容实际为“VD Mgmt”子界面的内容:

Ÿ     VD Mgmt子界面显示了控制器下的RAID组列及Unconfigured Good硬盘的状态,如上图所示,目前控制器下存在一个RAID1组列,Unconfigured Good硬盘共5块并均处于Ready状态;

Ÿ     将光标移至“AVAGO MegaRAID SAS 9361-8i(Bus 0x1aDev 0x00)”,键入F2,可以进行创建\删除RAID组列、导入外部配置、设置JBOD硬盘等操作;

Ÿ     将光标移至“Drive Group”,键入F2,可选中的RAID组列进行删除、热备盘设置等操作。

VD Mgmt子界面外,LSI 9361-8i管理界面下还存在PD MgmtCtrl MgmtProperties子界面,各子界面的功能说明如下:

52 LSI 9361-8i RAID卡管理子界面功能说明表

参数

含义

VD Mgmt

虚拟硬盘管理:Virtual Drive Management的缩写,该界面可查看Unconfigured Good硬盘状态、进行RAID组列的组建及管理等。

PD Mgmt

物理硬盘管理:Physical Drive Management的缩写,该界面可以查看硬盘信息、对物理硬盘进行操作。

Ctrl Mgmt

控制器管理:Controller Management的缩写,该界面可以对RAID卡控制器进行管理设置

Properties

RAID卡信息界面,可以查看RAIDFW/BIOS/Model等基础信息

PD Mgmt子界面

键入“Ctrl+N”,可切换至“PD Mgmt”子界面:

53 LSI 9361-8i RAIDPD Mgmt界面

该界面显示了RAID控制器下连接的硬盘及拓扑信息,界面内各部分内容说明如下:

53 LSI 9361-8i RAID PD Mgmt界面参数说明表

参数

含义

参数

含义

BackPlane

光标移至该项后,右侧信息栏会显示背板信息

State

硬盘当前状态

Slot

硬盘在控制器下的Slot

DG

Driver Group缩写,表示硬盘所属RAID组列

Type

硬盘类型

Vendor

硬盘制造厂商

Capacity

硬盘容量

界面右侧PAGE-1/2/3信息栏

将光标移至Backplane选项,信息栏将显示背板信息;光标移至指定硬盘,信息栏将显示对应硬盘信息。键入Tab键可将光标移至“GoToPage”选项

Ctrl Mgmt

键入“Ctrl+N”,可切换至“Ctrl Mgmt”子界面:

54 LSI 9361-8i RAIDCtrl Mgmt界面(1)

55 LSI 9361-8i RAIDCtrl Mgmt界面(2)

该界面显示了RAID控制器参数,可以根据需要进行设置。界面内各参数说明如下:

54 LSI 9361-8i RAID Ctrl Mgmt界面参数说明表

参数

含义

Alarm Control

板载蜂鸣器使能状态。

Coercion Mode

硬盘压缩模式设置

Bios Mode

Bios启动过程中遇到问题的处理方式:

Ÿ Stop on ErrorsBios遇到错误时停止启动,直到用户操作时才继续启动

Ÿ Pause on Errors:遇到错误时停止启动,用户一段时间没有操作则默认继续启动

Ÿ Ignore ErrorsBios遇到错误后默认忽略错误,继续启动

Ÿ Safe Mode on ErrorsBios遇到错误后,控制器将直接选择安全模式启动

Boot Device

启动盘设置,具体方法可参考5.1.7小节内容

Rebuild Rate

RAID组列重建时占用的IO资源百分比

BGI Rate

RAID组列后台初始化时占用的IO资源百分比

CC Rate

RAID组列一致性校验时占用的IO资源百分比

Recon. Rate

RAID组列扩容和级别迁移时占用的IO资源百分比

Patrol Rate

RAID组列巡读时占用的IO资源百分比

Cache flush Interval

Cache内数据刷新的时间间隔

Spinup delay

每组硬盘起转的时间间隔

Spinup Drive

允许同时起转的硬盘数

Device Exposure

预留功能

Maintain PD Fail History

是否记录硬盘故障。若设置为“Disable”,则遇到硬盘故障、RAID降级等故障时不会告警上报

Enable controller BIOS

控制器BIOS是否使能

Enable Stop CC on Error

一致性校验过程中遇到故障时是否停止

Auto Enhanced Import

是否自动导入外部配置信息

Enable JBOD

是否使能硬盘JBOD状态

Set Factory Defaults

恢复出厂设置

Emergency Spare

遇到故障时,哪些状态的硬盘可以当做紧急热备盘:NoneUGGHSUG&GHS

Personality Mode

RAID卡当前工作过模式:RAID-ModeJBOD Mode

Enable Emergency for SMARTer

是否对SMART出现故障的硬盘进行紧急热备处理

Write Verify

写校验

Large IO Support

是否支持大块IO数据传输

Manage Link Speed

接口传输速度管理

Manage Power Save

RAID卡硬盘节能策略设置

Apply

应用修改后的参数

Properties

键入“Ctrl+N”,可切换至“Properties”子界面,该界面显示了控制器的参数信息,具体描述可参考5.1.9控制器信息查看章节的内容。

4.1.3     创建RAID组列

步骤1 在“VD Mgmt”页面,使用“↑↓”键将光标移至控制器一栏,使用依据底部提示键入“F2”,如下图:

56 使用“↑↓”键将光标移至控制器一栏,键入“F2”

步骤2 选择“Create Virtual Drive”进入组建RAID界面,如下图:

57 Create Virtual Drive 页面

步骤3 RAID Level”一栏选择要组建的RAID级别,RAID级别的显示可能依据不同型号的产品RAID License不同而不同,以LSI 9361-8i为例,如下图:

 

58 RAID Level选择界面

步骤4 确定RAID级别后,如果所要组建RAIDRAID10/RAID50/RAID60,需要设置“PD per Span”值,即每个子RAID组列所包含硬盘数,依据不同RAID级别要求,RAID10只能选择大于等于2的偶数;RAID50/60可以选择大于等于3的数值;

步骤5 选择RAID组列的成员硬盘,以组建RAID1为例:

59 选择RAID组列的成员硬盘

如上图所示,如果所选择硬盘数量不符合所选RAID级别的要求,则“Size”一栏无法显示所支持的最大容量,“OK”选项也为灰色不可选状态;

正确选择硬盘数量后,界面如下图:

510 RAID成员盘选择完成

步骤6 Basic Settings”中可以设定RAID组列的容量大小以及名称;

步骤7 如果需要设置读写策略,可以选择“Advanced”进行设置,如下图:

511 设置读写策略

各选项含义可参考第2RAID卡特性章节的内容。

步骤8 默认的“Write Policy”为“Write Through”;在搭配有RAID卡电池/电容时建议选择Write Back;如果没有搭配RAID卡电池/电容,为了获得较高的性能,建议搭配HDD时选择“Write Back,搭配SSD时选择“Write Through”;

512 Write Policy设置

步骤9 选择OK”完成RAID组建。

513 选择“OK”完成RAID组建

步骤10 没有对组建RAID进行初始化,会弹出如下提示信息:

514 没有对组建RAID进行初始化弹出的提示信息

步骤11 选择“OK”跳过初始化,或者选择“Cancel”重新设置;

步骤12 RAID1组建完成,如下图:

515 RAID1组建完成

注:其他RAID级别的组建方式与此基本相同,按需组建即可。

4.1.4     删除RAID组列

删除RAID有以下3种方式:

方式一:删除某一具体的Virtual Drive

将光标移至Drive Group目录Virtual Driver下具体要删除的RAID一栏,键入“F2”,选择“Delete VD”;

516 选择“Delete VD”

弹出如下提示信息,选择“YES”确认删除:

517 弹出提示信息,选择“YES”确认删除

方式二:删除Drive Group上的所有RAID组列:

将光标移至所要删除的Drive Group一栏,键入“F2”,选择“Delete Drive Group”。

518 选择“Delete Drive Group”

会弹出提示删除信息,此操作会将此Drive Group上的多个RAID同时删除;

519 弹出提示删除信息

选择“YES”,确认删除。

方式三:清除RAID卡上的配置信息:

将光标移至RAID卡控制器一栏,键入“F2”,选择“Clear Configuration”;

520 选择“Clear Configuration”

选择后会弹出提示信息,此操作会将RAID控制器上所有的RAID配置信息清除;

521 弹出提示信息

选择“YES”,确认清除。

4.1.5     硬盘JBOD模式设置

步骤1 通过屏幕底部的提示键入“Ctrl + N/P”切换前后页面,进入“Ctrl Mgmt”页面;

步骤2 将光标移动至“Enable JBOD”一栏,通过space键进行勾选,然后将光标移至“APPLY”确认使设置生效,如下图:

522 勾选Enable JBOD选项

步骤3 通过屏幕底部的提示键入“Ctrl + N/P”切换前后页面,进入“PD Mgmt”页面,没有组建RAID或设置Hot Spare的硬盘状态会由“UG”变成“JBOD”,如下图:

523 JBOD设置成功

步骤4 JBOD模式的硬盘如果需要组建RAID,需要将JBOD模式修改为UG,才能够组建新的RAID

步骤5 设置为JBOD模式后,硬盘在系统下能够直接识别。

4.1.6     硬盘Unconfigured Good状态设置

步骤1 键入“Ctrl + N/P”切换前后页面,进入“PD Mgmt”页面,如下图:

524 进入“PD Mgmt”页面

步骤2 将光标移至具体某一块硬盘,键入“F2”,进入操作菜单,其中白色为可操作项,灰色会不可操作项。如果硬盘状态不是unconfigured good状态,可以将光标移至“Make unconfigured good”,键入Enter后即可将硬盘状态设置为unconfigured good

525 转换为unconfigured good状态

4.1.7     设置启动盘

当控制器下存在系统盘、但控制器默认的启动盘不是系统盘时,会导致服务器上电后无法正常从系统盘引导操作系统,如果出现这种情况,可设置控制器的启动盘为系统盘,从而让控制器每次上电后从固定的硬盘引导操作系统。设置方法如下:步骤1 键入“Ctrl + N/P”切换前后页面,进入“Ctrl Mgmt”页面,如下图所示,将光标移至“Boot Device”栏,按下Enter即可选择可以设置为启动盘的硬盘槽位,根据需要进行设置即可。

526 进入“Ctrl Mgmt”页面设置启动盘

4.1.8     硬盘定位

硬盘定位可将指定硬盘的定位灯亮起,从而辅助寻找硬盘。该功能需要具有定位功能的背板支持。

步骤1 CU界面中进入“PD Mgmt”子界面,选择想要定位的硬盘。

527 选择想要定位的硬盘

步骤2 按下F2后,光标移至“Locate”,选择“Start”后,按下“Enter”,此时在机箱前面板可以看到对应硬盘背板的定位LED灯亮起。

528 定位硬盘

步骤3 完成硬盘定位后,执行步骤12同样的操作,选择“Stop”即可看到硬盘背板的定位灯熄灭。

529 硬盘定位结束

4.1.9     控制器信息查看

步骤1 键入“Ctrl + N/P”切换前后页面,进入“Properties”页面,如下图:

530 进入“Properties”页面

步骤2 进入第二页:

531 进入第二页

55 LSI 9361-8i RAID卡“Properties”界面参数说明表

参数

含义

参数

含义

Product Name

控制器名称

Data Protection Support

是否支持数据保护

Controller Status

控制器当前状态

Data Protection Enabled

数据保护是否开启

Serial No

控制器序列号

Emergency Spare

可作为紧急热备盘的硬盘类型

ROC Temperature

RAID卡芯片温度

Emergency For SMARTer

对将要失效硬盘的紧急热备策略

Package

固件Package版本号

Power Saving on

Unconfigured Drives/

是否使用空闲盘节能策略

FW Version

FW版本号

Power Saving on Hot Spare

是否使用热备盘节能策略

Battery Status

电容/电池状态

Drive Standby Time

节能策略的准备时间

Controller ID

控制器ID

Copyback SSD on Smart

Error

SSD出现SMART错误时是否进行数据回拷

4.2     UEFI模式

4.2.1     进入BIOS将控制器设置为UEFI模式启动

启动系统进入BIOS,进入Advanced菜单,选中“PCIe Devices List”选项并进入:

532 进入PCIe Devices List

LSI Logic SAS3108下的Option ROM P0选项设置为“UEFI”,按下F4后保存,重启服务器:

533 SAS3108 Option ROM设置为UEFI

4.2.2     RAIDHII界面

HII界面为RAID卡在UEFI模式下进行RAID组建等配置操作的接口界面。

进入BIOS中,进入Advanced菜单,选中“AVAGO MegaRAID<AVAGO MegaRAID SAS 9361-8i>Configuraton Utility-03.25.05.04”,即可进入LSI 9361-8iHII管理界面

534 选择进入LSI 9361-8i HII管理界面

管理界面如图所示:

535 LSI 9361-8i HII管理界面

界面内各参数说明如下:

56 LSI 9361-8i RAIDHII界面参数说明表

参数

含义

参数

含义

Main Menu

进入控制器主界面

Virtual Drives

RAID组列数量

Help

获取帮助信息

View Server Profile

查看/修改控制器配置信息

Status

控制器当前状态

Configure

进行控制器配置操作

Current Personality

当前控制器模式

Set Factory Defaults

恢复出厂配置

Backplane

背板个数

Update Firmare

升级FW

BBU

超级电容是否在位

Silence Alarm

蜂鸣器使能状态(未配置蜂鸣器,该项无作用)

Enclosure

部件个数

Virtual Drive Operations in Progress

正在进行操作的RAID组列数量

Drives

控制器下硬盘数量

Drive Operations in Progress

正在进行操作的硬盘数量

Drive Groups

硬盘组数量

 

 

将光标移至“Main Menu”,键入Enter后进入RAID卡“Main Menu”界面:

536 Main Menu”界面

各参数说明如下:

57 LSI 9361-8i RAIDMain Menu界面参数说明表

参数

含义

Configuration Management

配置管理界面,该界面内可创建RAID组列、清除RAID组列配置、设置硬盘为JBODUnconfigured Good状态。

Controller Management

控制器管理界面,该界面内可进行控制器状态及各项参数查看、设置,设置启动盘、导出TTY日志等操作。

Virtual Drive Management

RAID组列管理界面,该界面内可进行RAID组列信息查看、定位、删除、重配置、初始化、一致性检查等操作。

Drive Management

硬盘管理界面,该界面内可进行硬盘信息查看、硬盘定位、热备盘设置、硬盘移除、状态设置等操作。

Hardware Components

该界面显示了RAID卡连接的硬件配件信息。

4.2.3     创建RAID组列

步骤1 HII界面选择“Configure”菜单项并进入组建RAID及配置界面。

537 进入配置界面

步骤2 RAID组建界面如下。该界面选择“Create Virtual Drive”功能,开始进行RAID组建。

538Create Virtual Drive

步骤3 当控制器下存在JBOD盘,进入RAID组列创建界面前将弹出如下界面,该界面下可以将JBOD模式的硬盘设置为Unconfigure Good状态。

539 RAID创建前硬盘设置

界面内各参数说明如下:

58 LSI 9361-8i RAIDRAID创建RAID组列前硬盘设置界面参数说明表

参数

含义

Maximum Allowed Unconfigured Good Drives

控制器下UG状态硬盘的最大支持数量

Eligible JBOD Drives for Conversion

可由JBOD转为UG状态的硬盘数量

Select JBOD drives To Make Unconfigured Good

JBOD盘选择界面,该信息下方会列出所有可由JBOD转为UG状态的硬盘,以供选择

OK

确认

Skip

跳过该步骤,直接进入RAID组建界面

如果存在需要将状态转换为Unconfigure Good状态的JBOD盘,只需将对应硬盘后的选项设置为Enabled,并点击OK确认状态转换即可。

如果不需要将JBOD模式的硬盘设置为Unconfigure Good状态,可以点击下方“Skip”跳过,直接进行RAID组建界面。

步骤4 RAID组建界面如下,该界面可以设置RAID级别、选择组建RAID的物理硬盘、VD名称、Strip Size大小、Read/Write Policy等参数。

540 RAID组列参数配置

界面内各参数说明如下:

59 LSI 9361-8i RAID组列参数配置界面说明表

参数

含义

参数

含义

Select RAID Level

选择创建RAID的级别

Read Policy

RAID组列的读策略

Protect Virtual Drive

RAID组列的数据保护功能是否开启

Write Policy

RAID组列的写策略

Select Drives From

RAID组列下成员盘来源

I/O Policy

RAID组列的I/O策略

Select Drives

选择成员盘

Access Policy

数据读取策略

Virtual Drive Name

RAID组列名称

Drive Cache

硬盘Cache策略

Virtual Drive Size

RAID组列的容量大小

Disable Backgroud Initialization

是否禁用后台初始化

Virtual Drive Size Unit

RAID组列的容量单位

Default Initialization

默认初始化方式设置

Strip Size

条带大小

Emulation Type

控制RAID组列在OS中上报的扇区

Ÿ Select RAID LevelLSI 9361-8i RAID卡支持的RAID级别为RAID 0/1/5/6/00/10/50/60

Ÿ Select Drives FromRAID组列成员盘来源可包括两方面:(1)Unconfigured Capacity:未加入过虚拟硬盘的空闲硬盘;(2)Free Capacity:已存在的虚拟硬盘的剩余空间;

Ÿ Strip SizeLSI SAS 3108 MR可支持的条带大小为64KB/128KB/256KB/512KB/1MB

Ÿ Read PolicyRAID组列的读策略有两种:(1)No Read Ahead:关闭预读取功能;(2)Read Ahead:开启预读取功能。在读取所请求的数据外,控制器会将请求数据所在地址之后的部分数据也读入到Cache中,以期望这些数据随后被系统使用时可以直接在Cache中命中,从而增快响应速度、提高读性能;

Ÿ Write PolicyRAID组列的写策略有三种:(1)Always Write Back:无论是否存在超级电容,都使用写回功能。控制器在将请求数据写入缓存后即反馈写操作完成。当没有超级电容时,异常掉电可能造成数据丢失;(2)Write Through:控制器在将请求写数据写入硬盘后才反馈写操作完成;(3)Write Back:当有超级电容时,使用写回功能,当没有超级电容或电容失效时,使用Write Through功能;

Ÿ I/O PolicyRAID组列的I/O策略有两种:(1)Direct:当Read Policy没有设置为Read Ahead时,读数据时使用No Read Ahead策略,当Write Policy没有设置为Write Through时,写数据时使用Write Cache策略;(2)Cached:所有读和写均经过RAIDCache处理。仅在配置CacheCade 1.1时需要设置为此参数值,其他场景不推荐;

Ÿ Access Policy:数据的读取策略有三种:(1)Read/Write:可读可写;(2)Read Only:只读;(3)Blocked:禁止访问;

Ÿ Drive Cache:硬盘Cache策略包括两种:(1)Unchanged:保持当前的策略;(2)Enable:写数据时经过硬盘的写Cache,从而提高写性能,但如果没有保护机制,系统意外掉电会导致数据会丢失;(3)Disable:不使用硬盘的写Cache,即使系统意外掉电也不会造成数据丢失;

Ÿ Default Initialization:默认初始化方式:(1)No:不进行初始化;(2)Fast:快速初始化;(3)Full:完全初始化;

Ÿ Emulation Type:控制RAID组列在OS中上报的扇区:(1)当成员盘为512B/512B时,逻辑扇区为:1Default512B/512B2None512B/512B3Force512B/4KB(2) 当成员盘为512B/4KB时,逻辑扇区为:1Default512B/4KB2None512B/512B3Force512B/4KB

步骤5 在“Select RAID Level”一栏选择要组建的RAID级别,RAID级别的显示可能依据不同型号的产品RAID License不同而不同,以LSI 9361-8i为例,如下图:

541Select RAID Level

步骤4 RAID5为例,介绍RAID组建过程。

确定RAID级别后,按下“Select Drives”选项,选择要组建的RAID组列成员硬盘后,点击“Apply Changes”结束。

542 Select Drives

步骤6 点击“Virtual Drive Name”设置RAID组列的名称。

543 Virtual Drive Name”设置

步骤7 点击“Strip Size”设置条带大小,可选择的大小为:64KB/128KB/256KB/521KB/1MB,默认设置为256KB

544 Strip Size”设置

步骤8 如果需要设置读写策略,可以选择“Read Policy”、“Write Policy”进行设置。

545 设置读策略

546 设置写策略

步骤9 点击“Save Configuration”保存配置,组建RAID。在弹出的界面中需要将“Confirm”设置为Enable后才“Yes”选项才可以选择。

547 确认RAID组建

步骤10选择“Yes”完成RAID创建。

548 选择“OK”完成RAID组建

注:其他RAID级别的组建方式与此基本相同,按需组建即可。

4.2.4     删除RAID组列

步骤1 HII界面选择Main Menu,键入Enter进入。

549 进入Main Menu

步骤2 选择“Virtual Drive Management”,进入RAID组列管理界面。

550 选择“Virtual Drive Management”

步骤3 该界面会列出目前LSI 9361-8i上存在的RAID组列,选择想要删除的RAID组列后,点击进入。

551 选择要删除的RAID组列

步骤4 在“Operation”选项中选择“Delete Virtual Drive”,之后界面中会出现“GO”选项。

552 Delete Virtual Drive”功能选择

553 开始删除组列

步骤5 点击“GO”之后进入操作确认界面,将“Confirm”设置为Enabled后,选择“YES”确认删除RAID组列。

554 确认删除RAID组列

步骤6 弹出如下界面表示RAID组列删除完成。

555 组列删除完成

4.2.5     硬盘JBOD模式设置

步骤1进入HII主界面,选择“Main Menu”,进入配置界面。

556 选择Main Menu

步骤2 将光标移动至“Controller Management”一栏,进入控制器管理界面。

557 选择Controller Management

步骤3 将光标移动至“Advanced Controller Properties”一栏,进入控制器高级管理界面。

558 选择Advanced Controller Properties

步骤4 将光标移动至“JBOD Mode”一栏,选择Enabled开启JBOD模式。

559 选择Enable

步骤5 将光标移动至“Apply Changes”,回车执行,使设置生效。

步骤6 进入HII主界面,选择“Configure”,进入配置界面。

560 进入配置界面

步骤7 将光标移动至“Make JBOD”一栏,进行物理硬盘JBOD设置界面。

561 选择“Make JBOD”

步骤8选择想要设置为JBOD模式的硬盘,设为“Enabled”后,点击“OK”进入操作确认界面。

562 JBOD盘选择

步骤9 将“Confirm”设置为Enabled后,选择“YES”确认设置。

563 确认进行JBOD设置

步骤10 弹出如下界面表示JBOD设置完成。

564 JBOD设置完成

步骤11 返回HII主界面,选择进入“View Server Profile”,在“View Server Profile”界面选择“Drive Management”,进行硬盘状态的查看。

565 进入“View Server Profile

566 进入“Drive Management”

步骤12 Drive Management”界面显示了控制器下各硬盘的状态,可在此查看JBOD设置的结果。

567 控制器下各硬盘状态

4.2.6     硬盘Unconfigured Good状态设置

JBOD盘无法进行RAID组建,只有处于Unconfigure Good状态的硬盘才能进行。

步骤1 进入HII主界面,选择“Configure”,进入配置界面。

568 进入配置界面

步骤2 将光标移至“Make Unconfigure Good”,进入操作界面。

569 进入“Make Unconfigure Good”界面

步骤3 选择想要设置为Unconfigured Good的硬盘,设为“Enabled”后,点击“OK”进入操作确认界面。

 

570 选择要转换为Unconfigure Good状态的硬盘

步骤4 将“Confirm”设置为Enabled后,选择“YES”确认设置。

571 确认进行Unconfigured Good状态设置

步骤5 弹出如下界面表示Unconfigured Good状态设置完成。

572 Unconfigured Good状态设置完成

4.2.7     设置启动盘

当控制器下存在系统盘、但控制器默认的启动盘不是系统盘时,会导致服务器上电后无法正常从系统盘引导操作系统,如果出现这种情况,可设置控制器的启动盘为系统盘,从而让控制器每次上电后从固定的硬盘引导操作系统。设置方法如下:

步骤1 进入HII主界面,选择进入“Main Menu”界面。

573 进入“Main Menu

步骤2 选择进入“Controller Management”控制器管理界面。

574 进入“Controller Management

步骤3 将“Select Boot Device”选项设置为想要启动的硬盘即可。

575Select Boot Device”界面

4.2.8     硬盘定位

硬盘定位可将指定硬盘的定位灯亮起,从而辅助寻找硬盘。该功能需要具有定位功能的背板支持。

步骤1 进入BIOS中,进入Advanced菜单,选中“AVAGO MegaRAID <AVAGO MegaRAID SAS 9361-8i>Configuration Utility-03.25.05.04”,进入HBA卡管理界面:

576 进入LSI 9361-8i HBA卡管理界面

步骤2 HBA卡管理界面,选择“Main Menu”,键入Enter进入:

577 LSI 9361-8i HBA卡管理界面

步骤3 选择“Drive Management”,并键入Enter进入硬盘管理界面:

578 LSI 9361-8i HBA卡“Main Menu”界面

步骤4 将光标移至想要定位的硬盘,键入Enter后即可进入硬盘信息查看界面:

579 LSI 9361-8i HBA卡“Drive Management”界面

步骤5 在硬盘信息界面内,将光标移至“Operation”,键入Enter后选择“Start Locate”选项。

580 LSI 9361-8i HBA卡选择进行“Start Locate

步骤6 将光标移至“Go”,键入Enter后即可进行硬盘定位,定位时硬盘对应的定位灯会亮起:

581 LSI 9361-8i HBA卡硬盘定位

步骤7 若要关闭定位灯,在步骤4选择“Stop Locate”即可。

4.2.9     控制器信息查看

步骤1 HII主界面选择“Main Menu”,然后进入“Controller Management”控制器管理界面。

582 进入“Controller Management”控制器管理界面

步骤2 从该界面即可读出RAID卡的基础信息。

 

583 Controller Management界面

各参数的具体说明如下:

510 LSI 9361-8i RAID卡“Controller Management”控制器管理界面参数说明表

参数

含义

参数

含义

Product Name

控制器名称

Firmware Version

FW版本号

Serial Number

控制器序列号

NVDATA Version

NVDATA版本号

Controller Status

控制器当前状态

Connector Count

物理端口数量

Select Boot Device

当前启动盘

Driver Count

连接的硬盘数量

PCI ID

PCI ID

Virtual Drive Count

RAID组列数量

PCI Slot Number

PCI槽位号

Advnced Controller Management

高级控制器管理

Package Version

固件Package版本号

Advnced Controller Properties

高级控制器参数


5     LSI SAS3808/3816 IT

公司目前在用的基于LSI SAS3808 ITLSI SAS3816 IT芯片的HBA卡分别为LSI 9500-8iLSI 9500- 16iSAS3808/3816支持UEFILegacy两种模式,仅支持在UEFI模式下进行控制器配置。

本章主要介绍UEFI模式。下面以LSI 9500-8i HBA卡为例介绍使用方法,所述内容同样适用于LSI 9500-16i HBA卡。

5.1     进入BIOS将控制器设置为UEFI模式启动

步骤1 启动系统进入BIOS,进入Advanced菜单,选中“PCIe Devices List”选项并进入:

91进入PCIe Devices List

步骤2 LSI Logic SAS controller下的Option ROM P0选项设置为“UEFI”按下F4后保存,重启服务器:

92SAS3808 Option ROM设置为UEFI

5.2     进入HBA卡管理界面

步骤1 进入BIOS中,进入Advanced菜单,选中“HBA 9500-8i (PCISlot=0xA) Configuration”,即可进入HBA卡管理界面:

93进入LSI 9500-8i HBA卡管理界面

步骤2 管理界面如图所示:

94 LSI 9500-8i HBA卡管理界面

界面内各参数说明如下:

91 LSI 9500-8i HBA卡管理界面参数说明表

参数

含义

Controller Properties

查看当前控制器的参数信息

Refresh Topology

首次使用控制器或出现硬盘热插拔后,使用该选项刷新硬盘拓扑信息

Device Properties

查看控制器下连接的硬盘参数信息、硬盘拓扑结构

5.3     控制器信息查看

步骤1 进入BIOS中,进入Advanced菜单,选中“HBA 9500-8i (PCISlot=0xA) Configuration”,进入HBA卡管理界面:

95进入LSI 9500-8i HBA卡管理界面

步骤2 HBA卡管理界面,选择“Controller Properties”,键入Enter进入

96 LSI 9500-8i HBA卡管理界面

步骤3 Controller Properties”界面显示了控制器的信息:

97 LSI 9500-8i HBA卡“Controller Properties”界面

界面内各参数说明如下:

92 LSI 9500-8i HBA卡“Controller Properties”界面参数说明表

参数

含义

参数

含义

Controller Name

控制器名称

SAS Adress

控制器SAS地址

Chip Name

控制器所用芯片名称

Firmware Version

控制器FW版本号

PCI Revision ID

控制器的PCI 版本ID

UEFI BSD HII Version

UEFI模式BIOS版本号

PCI Bus:Dev:Func

控制器的PCI设备号

Legacy BIOS Version

Legacy模式BIOS版本号

PCI Slot

控制器所在的PCI槽位号

Default NVData Version

默认的控制器NVData版本号

PCI Ven:Dev

控制器的厂商设备号

Persistent NVData Version

永久的NVData版本号

PCI SSVen:SSDev

控制器的子厂商设备号

Number of SAS & SATA Devices

控制器连接的SASSATA硬盘的数量

Serial Number

控制器的序列号

Number of Enclosures

控制器下Enclosures数量

5.4     硬盘信息查看

步骤1 进入BIOS中,进入Advanced菜单,选中“HBA 9500-8i (PCISlot=0xA) Configuration”,进入HBA卡管理界面:

98进入LSI 9500-8i HBA卡管理界面

步骤2 HBA卡管理界面,选择“Device Properties”,键入Enter进入:

99 LSI 9500-8i HBA卡管理界面

步骤3 在“Device Properties”界面可以看到LSI 9500-8i HBA卡下的Enclosure

910 LSI 9500-8i HBA卡“Device Properties”界面

步骤4 选择“Enclosure (Enclosure Level=0)”,键入“Enter”即可看到如下信息:

911 LSI 9500-8i HBAEnclosure (Enclosure Level=0)界面

步骤5 将光标移至想要查看的硬盘处,键入Enter即可查看硬盘信息:

912 LSI 9500-8i HBA硬盘信息查看

各参数说明如下:

93 LSI 9500-8i HBA卡硬盘信息查看界面参数说明表

参数

含义

参数

含义

Device Type

设备类型

Multipath Device

硬盘是否为多路径连接

Protocol

硬盘所用传输协议

SAS Address

硬盘SAS地址

Slot Number

硬盘所在Slot

Neg . Logical Link Rate

自协商后硬盘的逻辑链路传输速率

Vendor Name

硬盘厂商名称

Neg . Physical Link Rate

自协商后硬盘的物理链路传输速率

Product Name

硬盘型号

Max Drive Rate

硬盘最大传输速率

Revision Name

硬盘版本号

Write Cache

硬盘是否开启了写缓存

Serial Number

硬盘序列号

Located LED

硬盘定位灯

Capacity

硬盘容量大小

Legacy OpROM Boot Device

硬盘是否为Legacy启动模式下的启动盘

Logical/Physical Sector Size

硬盘逻辑扇区/物理扇区大小

Next Direct Attached Device

显示下一个硬盘的信息

5.5     设置启动盘

当控制器下存在系统盘、但控制器默认的启动盘不是系统盘时,会导致服务器上电后无法正常从系统盘引导操作系统,如果出现这种情况,可设置控制器的启动盘为系统盘,从而让控制器每次上电后从固定的硬盘引导操作系统。设置方法如下:

步骤1 进入BIOS中,进入Advanced菜单,选中“HBA 9500-8i (PCISlot=0xA) Configuration”,进入HBA卡管理界面:

913进入LSI 9500-8i HBA卡管理界面

步骤2 HBA卡管理界面,选择“Device Properties”,键入Enter进入:

914 LSI 9500-8i HBA卡管理界面

步骤3 在“Device Properties”界面可以看到连接至LSI 9500-8i HBA卡的背板:

915 LSI 9500-8i HBA卡“Device Properties”界面

步骤4 选择背板“Enclosure (Enclosure Level=0)”,键入“Enter”即可看到连接到背板上的硬盘:

916 LSI 9500-8i HBAEnclosure (Enclosure Level=0)界面

步骤4 将光标移至想要设置为启动盘的硬盘,键入Enter进入硬盘信息查看界面,通过设置界面中“Legacy OpROM Boot Device”选项为YesNo,可以设置该硬盘是否作为Legacy启动模式下的默认启动盘。

917 LSI 9500-8i HBA启动盘设置

5.6     硬盘定位

硬盘定位可将指定硬盘的定位灯亮起,从而辅助寻找硬盘。该功能需要具有定位功能的背板支持。

步骤1 进入BIOS中,进入Advanced菜单,选中“HBA 9500-8i (PCISlot=0xA) Configuration”,进入HBA卡管理界面:

918进入LSI 9500-8i HBA卡管理界面

步骤2 HBA卡管理界面,选择“Device Properties”,键入Enter进入:

919 LSI 9500-8i HBA卡管理界面

步骤3 在“Device Properties”界面可以看到连接至LSI 9500-8i HBA卡的Enclosure

920 LSI 9500-8i HBA卡“Device Properties”界面

步骤4 选择背板“Enclosure (Enclosure Level=0)”,键入“Enter”即可看到连接到Enclosure的硬盘:

921 LSI 9500-8i HBAEnclosure (Enclosure Level=0)界面

步骤5 将光标移至想要定位的硬盘,键入Enter进入硬盘信息查看界面,通过设置界面中“Located LED”选项为OnOff,可以实现对硬盘的定位,定位时对应硬盘背板的定位灯会亮起。

922 LSI 9500-8i HBA定位

 


6     LSI SAS3908/3916 MR

公司目前在用的基于LSI SAS3908LSI SAS3916芯片的RAID卡分别为LSI 9560-8iLSI 9560-16i

SAS3908/3916支持LegacyUEFI两种启动方式,但在Legacy模式下不支持进行RAID配置,仅在UEFI模式下可以进行,因此,如果需要离线配置RAID组列,需切换到UEFI模式进行,本文主要介绍UEFI模式。

下面以LSI 9560-8i RAID卡为例介绍使用方法,所述内容同样适用于LSI 9560-16i RAID卡。

6.1     RAID级别及参数介绍

LSI 9560-8i支持的RAID级别及相关参数如下表所示。

101 LSI 9560-8i RAID级别介绍

RAID级别

成员盘数量

子组数量

子组硬盘数量

允许最大坏盘数

RAID 0

1~32

NA

NA

0

RAID 1

2~32(偶数)

NA

NA

硬盘数÷2

RAID 5

3~32

NA

NA

1

RAID 6

4~32

NA

NA

2

RAID 10

4~128(偶数)

2~8

2~32

子组数

RAID 50

6~240

2~8

3~32

子组数

RAID 60

8~240

2~8

3~32

子组数*2

Ÿ 子组数表示了RAID 10/50/60组列中包含的RAID1/5/6子组列的数量,如:两组RAID1组成的RAID10组列,子组数为2

Ÿ RAID 1/10需使用偶数块成员盘

进入BIOS将控制器设置为UEFI模式启动系统进入BIOS,进入Advanced菜单,选中“PCIe Devices List”选项并进入:

101 进入PCIe Devices List

LSI Logic RAID controller下的Option ROM P0设置为UEFI,按下F4后保存,重启服务器:

102 SAS3908 Option ROM设置为UEFI

6.2     RAIDHII界面

HII界面为RAID卡在UEFI模式下进行RAID组建等配置操作的接口界面。

进入BIOS中,进入Advanced菜单,选中“BROADCOM <MegaRAID 9560-8i 4GB> Configuration Utility -07.14.06.00”,即可进入LSI 9560-8i HII界面:

103 选择进入9560-8i HII界面

HII界面如图所示:

104 HII主界面

各参数说明如下:

102 LSI 9560-8i RAIDHII主界面参数说明表

参数

含义

参数

含义

Main Menu

进入控制器主界面

Virtual Drives

控制器下RAID组列数量

Help

获取帮助信息

View Server Profile

查看/修改控制器配置信息

Status

控制器当前状态

Configure

进行控制器配置操作

Backplane

背板个数

Set Factory Defaults

恢复出厂配置

CacheVault

超级电容是否在位

Update Firmare

升级FW

Enclosure

控制器下Enclosure个数

Silence Alarm

蜂鸣器使能状态

Drives

控制器下硬盘数量

Virture Drive Operations

in Progress

正在进行操作的虚拟硬盘数量

JBODs

控制器下JBOD盘个数

Drive Operations in Progress

正在进行操作的硬盘数量

Drive Groups

控制器下硬盘组数量

 

 

将光标移至“Main Menu”,键入Enter后进入RAID卡“Main Menu”界面:

105 Main Menu”界面

各参数说明如下:

103 LSI 9560-8i RAIDMain Menu界面参数说明表

参数

含义

Configuration Management

配置管理界面,该界面内可创建RAID组列、清除RAID组列配置、设置硬盘为JBODUnconfigured Good状态。

Controller Management

控制器管理界面,该界面内可进行控制器状态及各项参数查看、设置,设置启动盘、导出TTY日志等操作。

Virtual Drive Management

RAID组列管理界面,该界面内可进行RAID组列信息查看、定位、删除、重配置、初始化、一致性检查等操作。

Drive Management

硬盘管理界面,该界面内可进行硬盘信息查看、硬盘定位、热备盘设置、硬盘移除、状态设置等操作。

Hardware Components

该界面显示了RAID卡连接的硬件配件信息。

6.3     创建RAID组列

步骤1 HII界面选择“Configure”菜单项并进入组建RAID及配置界面。

106 进入配置界面

步骤2 RAID组建界面如下。该界面选择“Create Virtual Drive”功能,开始进行RAID组建。

107Create Virtual Drive

步骤3 如下界面为组建RAID前的配置界面,该界面提供了将JBOD模式的硬盘设置为Unconfigure Good状态的快捷操作,是否进行该操作可以根据实际需要选择。

点击下方“Skip”开始进行RAID组建。

108 RAID组列创建前硬盘设置

界面内各参数说明如下:

104 LSI 9560-8i RAID组列创建前硬盘设置界面参数说明表

参数

含义

Maximum Allowed Unconfigured Good Drives

控制器下UG状态硬盘的最大支持数量

Eligible JBOD Drives for Conversion

可由JBOD转为UG状态的硬盘数量

Select JBOD drives To Make Unconfigured Good

JBOD盘选择界面,该信息下方会列出所有可由JBOD转为UG状态的硬盘,以供选择

Check All

全部选择

Uncheck All

全部取消

OK

确认

Skip

跳过该步骤,直接进入RAID组建界面

步骤4 RAID组建界面如下,该界面可以选择RAID级别、选择组建RAID的物理硬盘、VD名称、Strip Size大小、Read/Write Policy等参数。

109 RAID组列参数配置

界面内各参数说明如下:

105 LSI 9560-8i RAID组列参数设置界面说明表

参数

含义

参数

含义

Select RAID Level

选择创建RAID的级别

Read Policy

RAID组列的读策略

Umap Capability

是否支持Umap

Write Policy

RAID组列的写策略

Select Drives From

RAID组列下成员盘来源

I/O Policy

RAID组列的I/O策略

Select Drives

选择成员盘

Access Policy

数据读取策略

Virtual Drive Name

RAID组列名称

Drive Cache

硬盘Cache策略

Virtual Drive Size

RAID组列的容量大小

Disable Backgroud Initialization

是否禁用后台初始化

Virtual Drive Size Unit

RAID组列的容量单位

Default Initialization

默认初始化方式设置

Strip Size

条带大小

Emulation Type

控制RAID组列在OS中上报的扇区

Ÿ Select RAID LevelLSI 9560-8i RAID卡支持的RAID级别为RAID 0/1/5/6/10/50/60

Ÿ Select Drives FromRAID组列成员盘来源可包括两方面:(1)Unconfigured Capacity:未加入过虚拟硬盘的空闲硬盘;(2)Free Capacity:已存在的虚拟硬盘的剩余空间;

Ÿ Strip SizeLSI SAS3908/3916 MR可支持的条带大小为64KB/128KB/256KB/512KB/1M

Ÿ Read PolicyRAID组列的读策略有两种:(1)No Read Ahead:关闭预读取功能;(2)Read Ahead:开启预读取功能,在读取所请求的数据外,将所请求数据后面的部分数据读入到Cache中,期望这些数据能够很快被系统请求;

Ÿ Write PolicyRAID组列的写策略有三种:(1)Always Write Back:无论是否存在超级电容,都使用写回功能。控制器在将请求数据写入缓存后即反馈写操作完成。当没有超级电容时,异常掉电可能造成数据丢失;(2)Write Through:控制器在将请求写数据写入硬盘后才反馈写操作完成;(3)Write Back:当有超级电容时,使用写回功能,当没有超级电容或电容失效时,使用Write Through功能;

Ÿ I/O PolicyRAID组列的I/O策略有两种:(1)Direct:当Read Policy没有设置为Read Ahead时,读数据时使用No Read Ahead策略,当Write Policy没有设置为Write Through时,写数据时使用Write Cache策略;(2)Cached:所有读和写均经过RAIDCache处理。仅在配置CacheCade 1.1时需要设置为此参数值,其他场景不推荐;

Ÿ Access Policy:数据的读取策略有三种:(1)Read/Write:可读可写;(2)Read Only:只读;(3)Blocked:禁止访问;

Ÿ Drive Cache:硬盘Cache策略包括两种:(1)Unchanged:保持当前的策略;(2)Enable:写数据时经过硬盘的写Cache,从而提高写性能,但如果没有保护机制,系统意外掉电会导致数据会丢失;(3)Disable:不使用硬盘的写Cache,即使系统意外掉电也不会造成数据丢失;

Ÿ Default Initialization:默认初始化方式:(1)No:不进行初始化;(2)Fast:快速初始化;(3)Full:完全初始化;

Ÿ Emulation Type:控制RAID组列在OS中上报的扇区:(1)当成员盘为512B/512B时,逻辑扇区为:1Default512B/512B2None512B/512B3Force512B/4KB(2) 当成员盘为512B/4KB时,逻辑扇区为:1Default512B/4KB2None512B/512B3Force512B/4KB

步骤5 在“Select RAID Level”一栏选择要组建的RAID级别,RAID级别的显示可能依据不同型号的产品RAID License不同而不同,以LSI 9560-8i为例,如下图:

1010Select RAID Level

步骤6 RAID5为例,介绍RAID组建过程。

确定RAID级别后,按下“Select Drives”选项,选择要组建的RAID组列成员硬盘后,点击“Apply Changes”结束。

1011 Select Drives

步骤7 点击“Virtual Drive Name”设置RAID组列的名称。

1012 Virtual Drive Name”设置

步骤8 点击“Strip Size”设置条带大小,可选择的大小为:64KB/128KB/256KB/521KB/1MB,默认设置为256KB

1013 Strip Size”设置

步骤9 如果需要设置读写策略,可以选择“Read Policy”、“Write Policy”进行设置。

1014 设置读策略

1015 设置写策略

步骤10 点击“Save Configuration”保存配置,组建RAID。在弹出的界面中需要将“Confirm”设置为Enable后才“Yes”选项才可以选择。

1016 确认RAID组建

步骤11选择“Yes”完成RAID创建。

1017 选择“OK”完成RAID组建

注:其他RAID级别的组建方式与此基本相同,按需组建即可。

6.4     删除RAID组列

步骤1 HII界面选择Main Menu,键入Enter进入。

1018 进入Main Menu

步骤2 选择“Virtual Drive Management”,进入RAID组列管理界面。

1019 选择“Virtual Drive Management”

步骤3 该界面会列出目前LSI 9560-8i上存在的RAID组列,选择想要删除的RAID组列后,点击进入。

1020 选择要删除的RAID组列

步骤4 在“Operation”选项中选择“Delete Virtual Drive”,之后界面中会出现“GO”选项。

1021 Delete Virtual Drive”功能选择

1022 开始删除组列

步骤5 点击“GO”之后进入操作确认界面,将“Confirm”设置为Enabled后,选择“YES”确认删除RAID组列。

1023 确认删除RAID组列

步骤6 弹出如下界面表示RAID组列删除完成。

1024 组列删除完成

6.5     硬盘JBOD模式设置

步骤1 进入HII主界面,选择“Configure”,进入配置界面。

1025 进入配置界面

步骤2 将光标移动至“Make JBOD”一栏,进行物理硬盘JBOD设置界面。

1026 选择“Make JBOD”

步骤3 选择想要设置为JBOD模式的硬盘,设为“Enabled”后,点击“OK”进入操作确认界面。

1027 JBOD盘选择

步骤4 将“Confirm”设置为Enabled后,选择“YES”确认设置。

1028 确认JBOD设置

步骤5 弹出如下界面表示JBOD设置完成。

1029 JBOD设置完成

步骤6 返回HII主界面,选择进入“View Server Profile”,在“View Server Profile”界面选择“Drive Management”,进行硬盘状态的查看。

1030 进入“View Server Profile

1031 进入“Drive Management”

步骤7 Drive Management”界面显示了控制器下各硬盘的状态,可在此查看JBOD设置的结果。

1032 查看控制器下各硬盘状态

6.6     硬盘Unconfigure Good状态设置

JBOD盘无法进行RAID组建,只有处于Unconfigure Good状态的硬盘才能进行。

步骤1 进入HII主界面,选择“Configure”,进入配置界面。

1033 进入配置界面

步骤2 将光标移至“Make Unconfigure Good”,进入操作界面。

1034 进入“Make Unconfigure Good”

步骤3 选择想要设置为Unconfigured Good的硬盘,设为“Enabled”后,点击“OK”进入操作确认界面。

 

1035 硬盘选择界面

步骤4 将“Confirm”设置为Enabled后,选择“YES”确认设置。

1036 确认进行Unconfigured Good状态设置

步骤5 弹出如下界面表示Unconfigured Good状态设置完成。

1037 Unconfigured Good状态设置完成

6.7     设置启动盘

当控制器下存在系统盘、但控制器默认的启动盘不是系统盘时,会导致服务器上电后无法正常从系统盘引导操作系统,如果出现这种情况,可设置控制器的启动盘为系统盘,从而让控制器每次上电后从固定的硬盘引导操作系统。设置方法如下:

步骤1 进入HII主界面,选择进入“Main Menu”界面。

1038 进入“Main Menu

步骤2 选择进入“Controller Management”控制器管理界面。

1039 进入“Controller Management

步骤3 将“Select Boot Device”选项设置为想要启动的硬盘即可。

 

1040 Select Boot Device”

6.8     硬盘定位

硬盘定位可将指定硬盘的定位灯亮起,从而辅助寻找硬盘。该功能需要具有定位功能的背板支持。

步骤1 进入HII主界面,选择进入“Main Menu”界面。

1041 进入“Main Menu

步骤2 选择进入“Drive Management”控制器管理界面。

1042 选择进入“Drive Management

步骤3 将光标移至想要定位的硬盘,键入Enter后即可进入硬盘信息查看界面:

1043 LSI 9560-8i Drive Management”界面

步骤4 在硬盘信息界面内,将光标移至“Operation”,键入Enter后选择“Start Locate”选项。

1044 LSI 9560-8i选择进行“Start Locate

步骤5 将光标移至“Go”,键入Enter后即可进行硬盘定位,定位时硬盘对应的定位灯会亮起:

1045 LSI 9560-8i硬盘定位

步骤6 若要关闭定位灯,在步骤4选择“Stop Locate”即可。

6.9     控制器信息查看

步骤1 HII主界面选择“Main Menu”,然后进入“Controller Management”控制器管理界面。

1046 进入“Controller Management”控制器管理界面

步骤2 从该界面即可读出RAID卡的基础信息。

1047 Controller Management界面

各参数的具体说明如下:

106 LSI 9560-8i RAID卡“Controller Management”界面参数说明表

参数

含义

参数

含义

Product Name

控制器名称

Package Version

固件Package版本号

Serial Number

控制器序列号

Firmware Version

FW版本号

Controller Status

控制器当前状态

NVDATA Version

NVDATA版本号

Personality Mode

控制器当前工作模式

Supported Device Interfaces

控制器支持接口类型

Select Boot Device

当前启动盘

Connector Count

物理端口数量

PCI ID

PCI ID

Driver Count

连接的硬盘数量

PCI Segment:

Bus:Device:Function

PCI段号,BUS总线号,设备号,记忆控制器功能号

JBOD Count

控制器下JBOD盘数量

PCI Slot Number

PCI槽位号

Virtual Drive Count

RAID组列数量

 


7     FAQ

7.1     LSI SAS RAID卡相关FAQ

7.1.1     掉盘后蜂鸣器报警相关问题

RAID掉盘后,蜂鸣器会进行报警,此时处理措施分为两种:

Ÿ     在无HSP的情况下,请按照7.1.3的步骤更换新硬盘,等待Rebuild完成之后,蜂鸣器报警会自动停止;

Ÿ     在有HSP的情况下,RAID掉盘后HSP硬盘会自动替换已掉的硬盘,并自动进行RebuildRebuild结束后,蜂鸣器报警不会停止,目的在于提示用户需要及时替换或补充已掉的硬盘,此时,只有用户按照7.1.4的步骤更换新硬盘并完成COPYBACK,蜂鸣器报警才会自动停止。

下表汇总了LSI RAID卡蜂鸣器不同状态下的报警状态,遇到蜂鸣器报警现象时可以参照该表判断故障类型:

121 LSI RAID卡蜂鸣器报警状态说明表

事件

RAID组列状态

蜂鸣器报警状态

RAID0丢失1块成员盘

下线

3s,停1s

RAID1丢失1块成员盘

降级

1s,停1s

RAID1同时丢失2块成员盘

下线

3s,停1s

RAID5丢失1块成员盘

降级

1s,停1s

RAID5丢失2块或更多成员盘

下线

3s,停1s

RAID6丢失1块成员盘

部分降级

1s,停1s

RAID6丢失2块成员盘

降级

1s,停1s

RAID6丢失超过2块成员盘

下线

3s,停1s

热备盘完成重建,并成为RAID组列的成员盘

NA

1s,停3s

重建完成后正在进行数据回拷

正常

1s,停3s

7.1.2     RAID卡下的硬盘在系统BIOSOS下无法识别

LSI SAS 3108/3316/3908/3916 芯片的RAID卡,如LSI 9361/9560等,其所连接的硬盘处于Unconfigured Good状态,在BIOSOS下均无法直接识别;只有处于JBOD模式的硬盘才可以直接被BIOSOS识别。

7.1.3     Bad or missing RAID controller memory module…报错

搭配LSI SAS RAID控制器的平台上,开机在POST界面出现如下图报错:

121 Bad or Missing RAID controller memory module…报错

此报错提示RAID卡的缓存模块损坏或无法识别,出现此问题绝大多数为RAID卡的硬件存在故障或存在潜在隐患,应对RAID进行更换。

7.1.4     Single-bit ECC errors were detected…报错

搭配LSI SAS RAID控制器的平台上,开机在POST界面出现如下图报错:

single-bit ECC

122 Single-bit ECC errors were detected…报错

此报错提示在RAID上次启动过程中其缓存存在一位ECC校验错误,如果RAID缓存使用标准DRAM内存的话,建议对内存进行更换。

由于公司所用RAID卡其缓存颗粒固化在PCB上,无法单独更换缓存。出现此报错表示RAID卡缓存在使用过程中存在ECC校验错误,缓存部分存在硬件故障隐患,建议对RAID卡进行更换。

7.1.5     Multibit ECC errors were detected…报错

搭配LSI SAS RAID控制器的平台上,开机在POST界面出现如下图报错:

123 Multibit ECC errors were detected…报错

此报错提示在RAID上次启动过程中其缓存存在多位ECC校验错误,如果RAID缓存使用标准DRAM内存的话,建议对内存进行更换。

由于公司所用RAID卡其缓存颗粒固化在PCB上,无法单独更换缓存。出现此报错表示RAID卡缓存在使用过程中存在ECC校验错误,缓存部分存在硬件故障隐患,建议对RAID卡进行更换。

7.1.6     RAID卡下所连接硬盘的状态为Shield

RAID卡管理界面,RAID组列的显示颜色与其他的正常RAID组列不同,查看其下成员盘状态,发现显示为“Shield,如下图:

124 硬盘状态显示为“Shield

RAIDFirmware侦测到硬盘存在问题或者在通信过程中有信息丢失的时候,会将硬盘的状态转换为“FAILED”或“UNCONF BAD”。为了避免错误地进行状态转换,RAID卡会在把硬盘标记为“FAILED”或“UNCONF BAD”之前,将其状态标记为“Shield”。

Shield”状态下,RAID卡会将硬盘与RAID组列隔离,内部进行诊断测试,如果测试结果为正常,则将硬盘的状态恢复为正常状态;如果测试结果异常,则将硬盘标记为“FAILED”或“UNCONF BAD”。

一般情况下,如果硬盘被标记为“Shield”状态,极大可能硬盘自身硬件存在潜在隐患,建议对此状态下的硬盘进行更换。

7.1.7     RAID组列无法完成一致性校验

一致性校验(Consistency Check)只应用于存在数据冗余功能的RAID,如RAID1/10/5/50/6/60RAID0没有数据冗余功能,即不存在数据校验。

如果有数据冗余功能的RAID组列中的成员盘有“Media Error”、“Other Error”或“Predictive Error”,则可能导致在一致性校验的过程中由于某块硬盘的故障,无法正确检验RAID数据的完整性,导致一致性校验无法完成。

7.1.8     RAID组列降级后更换硬盘无法完成重建

对于有数据冗余功能的RAID,如RAID1/5/6等,RAID1/5能够允许一块硬盘掉线而不影响整体的数据完整性,RAID6能够允许两块硬盘掉线。

如果有硬盘掉线,更换全新硬盘后,能够自动或手动开始重建,如果除掉线硬盘之外,RAID组列中的其他硬盘存在“Media Error”、“Other Error”或“Predictive Error”,则在重建过程中可能由于其他硬盘的故障无法正确校验数据,导致无法正常完成重建。

RAID组列虽然能够提供一定的冗余能力,但是随着RAID组列成员盘的数量的增长,数据丢失的风险也随之增加。建议对RAID组列的成员盘定期进行检查,如果硬盘存在“Media Error”、“Other Error”或“Predictive Error”,则应及时进行更换。

7.1.9     控制器状态显示Controller Status: Need Attention

LSI SAS RAID控制器的控制器参数界面下,显示Controller StatusNeed Attention,如下图:

125 Controller StatusNeed Attention

有此提示,表示RAID卡的部分模块功能存在异常,建议及时查看。

Ÿ     一般情况下,是由于RAID卡掉盘等问题所导致的,建议对RAID卡所连接的硬盘及所组建的RAID状态进行检查,看是否存在硬盘掉盘、RAID组列降级或者硬盘“S.M.A.R.T stateError”等问题;

7.1.10     LSI SAS RAID控制器进入Safe Mode模式

搭配LSI SAS RAID控制器的服务器,进入RAID卡管理界面,发现 Controller is running in safe mode…提示,如下图所示:

126 Controller is running in safe mode

有关LSI SAS RAID Safe Mode的触发条件很多,如果控制器发生致命错误便会进入Safe Mode模式,大致有如下方面

Ÿ     DISCOVERY_ERROR:侦测错误,包括RAID卡及硬盘的硬盘错误;

Ÿ     LDS_CACHE_PINNED_HALT:逻辑硬盘缓存挂死;

Ÿ     INCOMPATIBLE_SECONDARY_IBUTTION:不兼容的RAID Key

Ÿ     CACHE_ERRORRAID卡缓存报错;

Ÿ     CTRL_DOWNGRADE_ERROR:控制器虚拟硬盘降级;

Ÿ     EMBEDDED_MULTIBIT_ECC_ERROR:控制器缓存多位ECC错误;

Ÿ     CONFIG_CHANGE_WARNING:控制器配置改变。

RAID卡进入Safe Mode后,建议以下步骤进行排查:

Ÿ     重连全部硬盘,进入管理界面查看RAID组列的状态;

Ÿ     在管理配置界面下查看硬盘的S.M.A.R.T state是否为No Error,如果存在显示状态为Error,建议更换硬盘;

Ÿ     关闭服务器,断开RAID卡与硬盘的连接,重启仍然进入Safe Mode,更换RAID卡;

Ÿ     如果以上均正常,上线具体应用,对系统整体稳定性进行分析。

7.1.11     Your VDs that are configured for write-back…提示,写策略自动变为WT

搭配LSI SAS RAID控制器的平台上,开机在POST界面出现如下图提示:

127 Your VDs that are configured for…提示

显示内容提示RAID组列的配置由于电池或者超级电容充电、无法识别或损坏导致暂时由Write Back切换为Write Through

此问题是由于RAID卡搭配了电容,并且在组建RAID时写策略选择了Write Back with BBU,在超级电容充电未完成、充电异常、电量过低或电容损坏的情况下,为了保证数据的完整性,控制器会自动改变RAID组列的写策略,调整为Write Trough

如果电容未能正常充电,检查RAID卡日志,可以看到如下的记录:

128 RAID卡日志中的提示

对于该现象,如果RAID卡搭配了电池或者超级电容,则需要检查电池或者超级电容的工作状态。如果电池或者超级电容处于充电状态,RAID卡电池需要数小时,超级电容需要数分钟,等待充电完成后检查其工作状态。如果确认RAID卡电池或超级电容无法识别,则需要对其进行更换。

如果要避免这种情况的发生,可以创建RAID时选择Write PolicyAWBAlways Write Back),但该写策略可能会导致数据丢失,请谨慎使用。

7.1.12     Cache data was lost due to…报错

搭配LSI SAS RAID控制器的平台上,开机在POST界面出现如下图报错:

129 Cache data was lost due to…报错

此报错为所使用的LSI SAS RAID卡没有搭配用于缓存数据保护的电池或者超级电容,且所创建的RAID组列的写策略为“Write Back”,所以在服务器异常掉电或者在有写入数据任务过程中重启服务器会导致写入RAID卡缓存中的数据没有及时刷写到硬盘中,且DRAM为易失性存储介质,掉电后保存在里面的数据会丢失。出现此种情况后会在POST界面出现上图所示报错。

如果对于数据的完整性要求极高,建议RAID卡搭配电池或者超级电容使用并将写策略设置为“Write Back with BBU”,如果未搭配电池或者超级电容,建议将RAID的写策略设置为“Write Through”,写入操作不会将数据进行缓存,直接写入到硬盘。

7.1.13     The battery hardware is missing…提示

搭配LSI SAS RAID控制器的平台上,开机在POST界面出现如下图提示:

1210 The battery hardware is missing…提示

显示内容提示RAID卡电池或超级电容丢失或者没有安装。

如果服务器RAID卡没有配RAID卡电池或超级电容,则可以忽略此提示,在屏幕打印以上信息时键入“D”即可消除此提示,在后续启动过程中将不会出现此提示。

如果搭配有RAID卡电池或超级电容,出现以上信息,则需要检查RAID卡电池或超级电容的工作状态,如果无法识别,应更换RAID卡电池或超级电容。

7.1.14     FW is in Fault State-MFI Register State 0Xf001000A报错

搭配LSI SAS RAID控制器的平台上,开机在POST界面出现如下图报错:

1211 FW is in Fault State…Adapter at Baseport is not responding”报错

此问题可能由以下两方面引起:

Ÿ     RAID卡所连接硬盘设备读写异常引起

Ÿ     RAID卡自身故障

可以通过以下步骤进行排除解决:

Ÿ     断开RAID卡与所有硬盘的连接,重启服务器;若故障仍然存在,更换RAID卡;如果故障消失,关机重连所有硬盘,检查硬盘状态;

Ÿ     上线具体应用,检查是否为应用对硬盘的分区及文件系统与RAID卡不兼容导致。

7.1.15     Invalid SAS topology detected…报错

搭配LSI SAS RAID控制器的平台上,开机在POST界面出现如下图报错:

1212 Invalid SAS topology detected…报错

显示内容提示检测到不可用的SAS拓扑。

此问题主要由不规范的SAS Expander级联引起,建议对设备的连接拓扑进行检查,查看有无不规范的SAS Expander级联现象。

7.1.16     重启后系统下盘符发生变化

系统重启后,硬盘在系统下的盘符可能会发生变化,比如之前盘符名称是sda的硬盘,在某次重启后可能变为sdb

下图所示为进行某次DC测试时的乱序现象:

1213 系统下出现盘符乱序

从图中可以看出,系统下的盘符出现了无规律的乱序。

该问题是Linux内核对设备文件的动态管理机制导致的,是操作系统自身的系统管理缺陷。由于Linux内核无法保证每次扫描、加载各驱动的顺序一致,同时也无法保证加载RAID控制器驱动后、扫描控制器下硬盘的顺序不变,所以导致盘符无法固定、无法与实际的物理槽位对应。

如果想规避系统下盘符乱序现象,可以考虑在Linux系统下使用udev工具进行盘符绑定,详情咨询公司工程师。

7.1.17     pcilib: sysfs_read_vpd: read failed: Input/output error告警

Linux系统下执行命令lspci -s xx:xx.x -xxxvvv会报pcilib: sysfs_read_vpd: read failed: Input/output error告警。

1214 pcilib: sysfs_read_vpd: read failed: Input/output error告警

该问题为Linux内核的VPD(Vital Product Data)黑名单机制引起,该黑名单是系统下的相关设置,对于RAID卡的使用没有功能性的影响,出现该问题可以不用处理。

7.1.18     使用SR02-A1061R M.2 RAID卡开机自检打印“Can't find any device”

SR02-A1061R M.2 RAID卡搭配Intel SSDIT SSDSCKKB240G8 240G M.2 SATA6G R SSD),non-RAID Mode下安装 RedHat/CentOS 8.x系统后,开机自检阶段会提示“Can't find any device

1215 Can't find any device告警

SR02-A1061R控制器厂商分析,0061_02及之前版本的固件与Intel SSDIT SSDSCKKB240G8 240G M.2 SATA6G R SSD)兼容性不够全面。non-RAID Mode下安装RedHat/CentOS 8.x系统后重启时,会错误地返回软复位状态字段,导致无法正确识别卡下的硬盘。该问题已在SR02-A1061R控制器0061_02版本之后的固件中得到解决。

7.1.19     在数据回写时LSI 9361-16i RAIDPCB板上的状态灯常亮,不闪烁

经厂商确认,LSI 9361-16i RAID卡在进行掉电数据回写时,状态灯不闪烁不是异常现象。经测试,回写完成后的数据包MD5校验结果与传输前一致,即:状态灯不闪烁不会影响到RAID卡掉电保护功能。

7.1.20     95系列RAID卡不支持设置JBOD

使用95系列RAID执行storcli /cx set jbod=on/off命令时,打印“Controller does not support JBOD”信息。

1216 Controller does not support JBOD告警

95系列RAID卡由于固件实现机制改变,不再支持单独设置JBOD状态为EnableDisable,可通过storcli /cx/ex/sx set jbod指令对具体盘进行设置。该现象为正常现象,不影响功能使用。

7.2     LSI SAS HBA卡相关FAQ

7.2.1     SAS Address NOT programmed on controller…报错

使用LSI SAS卡,在启动过程POST界面显示SAS Address NOT programmed on controller…报错,如下图:

1217 SAS Address NOT programmed on controller…报错

此问题是由于SAS卡没有刷新SAS Address导致SAS Address可以参考 12‑17

出现此问题后,可以使用SAS卡对应的刷新工具对SAS Address进行更新,SAS Address会在SASPCB上有标志,不同的SASSAS Address的贴纸格式不同,以SH16-L3216为例

 

1218 SAS AddressPCB上位置示例

以上图为例,刷新SAS Address的命令如下:

sas3flash -o -sasadd 5F80F41FEA76D00

7.2.2     LSI SAS卡未配置启动盘时概率进不去操作系统

服务器搭配LSI SAS HBA卡,反复对服务器上下电操作,有极小概率出现无法正常进入系统的情况,该问题产生原因是在控制器下没有指定系统启动盘,导致重启后BIOS无法在控制器下找到系统盘,从而无法正常引导操作系统

为了解决此问题,可以做如下操作:

Ÿ     进入SASOptionROM界面,在SAS Topology下展开硬盘列表,按Alt+BOS所在硬盘设置为Boot项,如下图

1219 键入Alt+B将具体硬盘设置为Boot

Ÿ     Advanced Adapter Properties->Advanced Device Properties目录下,设置可启动设备数量,如下图:

1220 设置可启动设备数量

a)     如果SAS卡连接了OS安装硬盘,建议将Maximum INT 13 Devices for this Adapter设置为1

b)     如果SAS卡只连接数据盘,无OS启动盘,建议将Maximum INT 13 Devices for this Adapter设置为0

设置成功后,在POST界面以及BIOS启动列表中,将只显示对应数量的硬盘,不再显示全部硬盘。

7.2.3     在系统下格式化SAS3216控制器下的希捷Haden 2.5 SATA SSD硬盘时报错

由于SAS3216控制器的HBAV16.00.11.00及之前版本的固件,对希捷Haden系列硬盘的兼容不够全面,导致使用SAS3216控制器的HBA卡搭配希捷Haden 2.5 SATA SSD硬盘(XA480LE10063XA240LE10003XA1920LE10063)时,执行格式化指令会出现I/O报错。经控制器厂商、硬盘厂商评估,此I/O报错对硬盘使用及数据没有影响。在SAS3216控制器V16.00.11.00之后的固件中,该问题已经得到解决。

7.2.4     mpt3sas: module verification failed: signature…告警

安装系统后,系统messages日志可能出现mpt3sas驱动模块的签名或密钥丢失的现象,messages日志中告警字段如下:mpt3sas: module verification failed: signature and/or required key missing - tainting kernel

1221 mpt3sas: module verification failed告警

该告警产生的原因是当前RAID卡驱动没有在使用的操作系统上进行签名认证。

由于RAID卡的驱动只在操作系统发行版的主节点版本上进行签名认证,所以对于有些操作系统,可能会出现如上告警,不过,该告警不会影响RAID卡的功能,可以正常使用。

7.2.5     使用SAS3008控制器IR固件组建RAID后安装VMware 6.7/7.0系统日志报错

使用SAS3008控制器IR版本的固件,组建RAID后安装VMware 6.7/7.0系统,dmesg日志会有“WARNING: lsi_msgpt3: _scsih_probe_raid:9905: Failed to rescan SCSI adapter Invalid, Invalid name”报错信息。

1222 Failed to rescan SCSI adapter Invalid, Invalid name告警

这是因为VMWare 6.7/7.0系统中IR固件的对应驱动在初始化阶段会抓取RAID组列的基本信息,而SAS3008控制器IR版本固件组建的RAID组列不包含name字段,驱动因没找到name字段信息,所以会产生Invalid name告警信息。此告警出现在RAID组列正常识别且处于Ready状态后,不会影响到RAID卡的功能和稳定性。

7.2.6     使用SAS3008控制器的HBA卡,BIOS界面下boot选项中最多只显示前24个硬盘

SAS3008控制器固件本身限制,支持的最大硬盘上报数量为24块,因此当SAS3008控制器下连接的硬盘数量大于24块时,在BIOS界面下的boot选项中仅能显示出前24个硬盘设备,如需显示出前24盘之后的硬盘,将该硬盘设置为bootdriver启动盘即可。

 


 

8     附录

8.1     LSI售后维护相关SOP

下面以LSI 9361-8i RAID 卡为例,详细介绍下LSI售后维护相关SOP的部分步骤。

在机器启动过程中看到以下界面时,按照屏幕提示按下快捷键CTRL+R,进入Configuration Utility界面(下文简称CU界面)。

131 进入Configuration Utility界面

132 Configuration Utility界面

8.1.1     Foreign硬盘引入

如果新插入的硬盘上有外部配置信息,如RAID配置信息(之前做过RAID并且没有清除配置信息),硬盘的状态将显示为“Foreign”,同时在上方菜单栏出现“Foreign View”菜单,如下图所示。此时需要对硬盘进行Import引入操作,才能正常使用。

133 标识为“FOREIGN”开头的硬盘查看

按下Ctrl+PCtrl+N,进入“VD Mgmt”界面,将光标移至“AVAGO MegaRAID SAS 9361-8iBus 0x1b, Dev 0x00)”,按下F2,在弹出的界面中选择“Foreign Config”选项,左侧会弹出操作界面中,可做进行Import引入或者Clear清除外部配置信息,下面进行介绍。

134 Import操作(1)

Ÿ     Import引入

Import操作将引入带有外部配置信息的RAID成员盘,如下图所示,点击“YES”后即可进行引入操作。

135 Import操作(2)

[注意]

对于某些RAID级别,只有当RAID配置信息中所有的成员盘均存在(外部配置信息完整)时才可以正确引入,否则按下“YES”后将会提示如下报错,导致引入失败。

136 Import操作(3)

Ÿ     Clear清除

该操作会清除该硬盘上的所有RAID组列信息,在“Foreign Config”选项中选择“Clear”后,会弹出如下界面,点击“YES”进行清除操作。

137 Clear操作

清除完成后,硬盘将自动变为Uncofigure Good状态,如下图所示。

138 Clear完成后硬盘将自动变为Uncofigure Good状态

[注意]

部分硬盘可能因RAID配置信息差异、背板槽位状态等原因,插入9361-8i后,在“PD Mgmt”中的状态显示为“UB”,而不是“Foreign”,如下图所示。

139 硬盘状态显示为UB

此时需要将光标移至该硬盘,并按下F2,在弹出的菜单中选择“Make unconfigure good”,并按下“Enter”,进行硬盘状态切换。

1310 “UB”状态切换为“Foreign

操作完成后,硬盘状态将重新显示为“Foreign”,之后按照本节所讲的Foreign硬盘的引入方法进行操作即可完成外部配置信息的引入。

8.1.2     RAID Volume添加热备盘(HSP)

RAID1RAID5RAID6中,热备盘(Hot spares)可以在工作中自动的替换不工作的硬盘。

热备盘分为两种:全局热备(Global HSP)与专用热备(Dedicated HSP)。Dedicated HSP只能用来替换特定的Drive Group中的不工作的硬盘,Global HSP可以用来替换任意Drive Group中的不工作的硬盘。

将准备好的服务器硬盘安装到服务器的空闲硬盘盘位上,并将硬盘设置为Uncofigure Good状态。如果服务器中已有未使用的Uncofigure Good状态硬盘,则不需要此步骤。

Ÿ     添加全局热备盘

步骤1 进入9361-8i CU界面,切换至“PD Mgmt”子界面,将光标移至想要作为全局热备盘的硬盘,如下图所示。

1311 选择想要作为全局热备盘的硬盘

步骤2 按下F2,在弹出的界面会出现“Make Global HS”选项。

1312 Make Global HS”选项

步骤3 按下“Enter”,即可将硬盘设置为全局热备盘。创建完成后的结果如下图所示。

1313 设置全局热备盘

Ÿ     添加专用热备盘

步骤1 9361-8i CU界面按下Ctrl+PCtrl+N,进入“VD Mgmt”子界面,将光标移至想要添加专用热备盘的RAID组列,按下F2,在弹出的界面中可以发现“Manage Ded. HS”选项,如下图所示。

1314 Manage Ded. HS”选项

步骤2 光标移至Manage Ded. HS”选项,按下“Enter,在专用热备盘选择界面选择想要作为热备盘的硬盘,点击右侧“OK”完成创建。

1315 选择想要作为热备盘的硬盘

步骤3 创建完成后,将光标移至RAID组列,在界面右侧可以看到该RAID组列的专用热备盘数量为1

1316 查看创建结果

8.1.3     在无HSP的情况下RAID掉盘后更换新硬盘方法

[注意]RAID1RAID5RAID6等具有冗余能力的RAID组列支持此操作,RAID0不支持。

RAID掉盘(损坏或者拔出一块硬盘)后,在9361-8i CU界面中的“VD Mgmt”子界面,会看到对应的RAID组列信息栏变成了红色或黄色,如下图所示。

1317 查看告警RAID组列

红色和黄色代表了两种告警级别,和RAID级别允许的掉盘数直接相关,对于有数据冗余功能的RAID,如RAID1/5/6等,RAID1/5能够允许一块硬盘掉线而不影响整体的数据完整性,RAID6能够允许两块硬盘掉线。

Ÿ     RAID0出现掉盘、3RAID52块盘时,均会出现红色报警;

Ÿ     RAID1/5/61块盘时,会出现黄色报警。

此时,在服务器掉盘硬盘位插入要换上的硬盘,如果新硬盘没有做过RAID或者RAID信息已经清除,则在“PD Mgmt”子界面中,可以看到RAID已经自动开始进行Rebuild

1318 硬盘开始进行Rebuild

Rebuild完成后,返回“VD Mgmt”子界面,可以看到RAID组列已恢复正常。

1319 Rebuild完成后组列RAID状态

8.1.4     在有HSP的情况下RAID掉盘后更换新硬盘方法

[注意]RAID1RAID5RAID6等具有冗余能力的RAID组列支持此操作,RAID0不支持。 在有HSP的情况下,RAID掉盘后会,HSP硬盘会自动替换已掉的硬盘,并自动进行RAID Rebuild,不会影响系统正常工作。

将准备好的服务器硬盘安装到服务器的空闲硬盘盘位上。如果服务器中已有未使用的硬盘,则不需要此步骤。

Ÿ     如果新插入的硬盘上没有RAID信息(该硬盘没有做过RAID或者RAID信息已经清除),LSI Controller将自动将此盘加入RAID中,并自动将HSP硬盘中的数据进行COPYBACK。拷贝完成后,RAID状态恢复完成,HSP硬盘恢复到换盘之前的空闲状态。此情况下,整个过程不需要用户对硬盘进行操作,全部由LSI Controller自动维护完成。

Ÿ     如果新插入的硬盘上有RAID信息(做过RAID并且RAID信息没有清除),在“PD Mgmt”子界面会将硬盘状态显示为“Foreign”或“UB”,此时需要先清除RAID配置信息,操作方法请参考13.1.1 Foreign硬盘引入章节中“Clear”外部配置信息的操作方法。完成清除操作后,按Ctrl+Alt+Del键重新启动计算机,当RAID卡初始化后,将自动将此盘加入RAID中,并自动将HSP硬盘中的数据进行COPYBACK。拷贝完成后,RAID状态恢复完成,HSP硬盘恢复到换盘之前的空闲状态,硬盘更换成功。

[注意] LSI Controller没有自动进行COPYBACK,则需手动进行设置,方法如下:

步骤1 在“PD Mgmt”子界面选择热备盘,按下F2,选择“Copyback”操作,按下“Start”进行COPYBACK

1320 COPYBACK功能选择

步骤2 此时会弹出硬盘选择界面,选择COPYBACK的目标硬盘后,按“OK”开始COPYBACK.

1321 选择目标硬盘

步骤3 等待COPYBACK完成即可。

1322 开始COPYBAK

8.2     Linux系统下LSI RAID卡工具简要操作说明

使用基于LSI RAID芯片的RAID卡,不止可以在RAID CU界面进行RAID操作及配置,还可以在Linux系统下使用管理工具进行同样的操作,本节将介绍RAID卡管理工具storcli的使用方法。

回去storcli工具安装包后,进行工具安装:

Ÿ     RHEL系列OS:使用命令:rpm –ivh ****.rpm进行安装。如果系统中已经存在storcli工具,升级工具可以使用命令:rpm -Uvh ****.rpm

Ÿ     Debian系列OS:使用命令sudo dpkg -i ****.deb安装,安装完成后可以使用dpkg -l | grep -i storcli命令检查是否安装成功。

storcli工具安装时将默认安装在/opt/MegaRAID/storcli目录中。下面以RHEL系列操作系统为例,介绍工具使用方法。

8.2.1     控制器下拓扑结构介绍

为了方便管理,控制器将其下网络拓扑关系按照如下图所示的结构进行了划分:

1323 控制器下管理结构

按照如图所示的3(Cotroller/Enclosures/Slot)结构划分方法,用户可以方便地根据图中ControllerEnclosuresSlot的编号实现硬盘的定位。为了进一步方便使用,storcli工具将Controller x简写为cx,将Enclosures x简写为ex,将Slot x简写为sx,其中x代表编号。

使用storcli /cx show命令即可查询每块硬盘的EnclosuresSlot编号。

13.2.2节介绍了cx的确定方法,13.2.4节介绍了exsx的确定方法。

8.2.2     查看服务器下控制器基本信息

/opt/MegaRAID/storcli/storcli64 show

该命令可以查看服务器上使用的RAID控制器数量,各控制器的顺序及简单信息。

下图为执行该命令后的打印信息,根据图中所示内容可知,此时服务器上连接了两块RAID卡,其中第一块RAID卡为LSI 9361-8i,序号为0,第二块RAID卡为SR16-3316,序号为1,即:c0表示LSI 9361-8ic1表示SR16-L3316。如果连接更多张RAID卡,以此类推即可。

1324 查看控制器基本信息

8.2.3     查看各控制器详细信息

/opt/MegaRAID/storcli/storcli64 /c0 show all

查看第一块RAID卡版本、功能、状态、以及RAID卡下的物理磁、逻辑盘信息。

命令执行后打印信息如下:

1325 查看控制器详细信息(1)

1326 查看控制器详细信息(2)

1327 查看控制器详细信息(3)

8.2.4     查询具体某块硬盘的信息

/opt/MegaRAID/storcli/storcli64 /c0 /e252 /s0 show all

上述命令表示查看Controller 0下,252Enclosures上编号为0Slot对应的硬盘详细信息。

其中,EnclosuresSlot编号可以使用storcli /c0 show命令查看,该命令作用为:查看Controller 0的基本信息,下图所示内容为命令执行后的部分打印信息,观察该图内容,可以得到Controller 0下的拓扑结构

1328 控制器下拓扑结构

根据上图可知,控制器0下连接了7块硬盘,每个硬盘的Enclosures均为252,但Slot编号不同。

若想查看容量为2.728 TB、接口为SASSlot0硬盘详细信息,使用/opt/MegaRAID/storcli/storcli64 /c0 /e252 /s0 show all即可:

1329 查询具体某块硬盘的信息(1

1330 查询具体某块硬盘的信息(2

如果不确定硬盘是否为需要操作的硬盘,可以使用以下命令进行定位。

8.2.5     定位某块硬盘

/opt/MegaRAID/storcli/storcli64 /c0 /e252 /s0 start locate

开始定位0号控制器、252号背板、0号槽位号的硬盘,执行后对应硬盘的定位灯会亮起;

/opt/MegaRAID/storcli/storcli64 /c0 /e252 /s0 stop locate

结束定位0号控制器、252号背板、0号槽位号的硬盘,执行后对应硬盘亮起的定位灯会熄灭。

1331 定位某块硬盘

8.2.6     将存在隐患的硬盘强制下线

使用/opt/MegaRAID/storcli/storcli64 /c0 /e252 /s0 show all命令查看硬盘信息后,如果Media Error CountPredictive Failure Count不为0,则表明硬盘已存在或存在潜在故障,此时建议将存在隐患的硬盘强制下线。

/opt/MegaRAID/storcli/storcli64 /c0 /e252 /s4 set offline

0号控制器下、背板号为252、槽位号为4的硬盘下线。

1332 将存在隐患的硬盘强制下线(1

1333 将存在隐患的硬盘强制下线(2

1334 将存在隐患的硬盘强制下线(3

进行此操作后对应硬盘Error状态灯会常亮,此操作会导致RAID降级,请谨慎使用。

8.2.7     查看rebuild进度

RAID组列存在热备盘的情况下,强制某块硬盘offline后,热备盘会自动进行Rebuild,通过以下命令查看0号控制器下、背板号为252、槽位号为6的硬盘rebuid进度。

/opt/MegaRAID/storcli/storcli64 /c0 /e252 /s6 show rebuild

1335 查看rebuild进度

8.2.8     更换硬盘

更换硬盘操作,将故障硬盘移除,在原来的槽位更换容量相同的硬盘,先查看硬盘状态,如果硬盘状态为UB(Unconfigured Bad),需要更改硬盘状态为Unconfigured Good,用如下命令0号控制器、252背板上2槽位的硬盘设置为UG状态

/opt/MegaRAID/storcli/storcli64 /c0 /e252 /s2 set good

然后,手动将之前恢复占用的热备盘中的数据回写到替换后的新盘,命令如下:

/opt/MegaRAID/storcli/storcli64 /c0 /e252 /s1 start copyback target=252:2

该操作会将252:1热备盘中的数据写到252:2硬盘中。

1336 手动将之前恢复占用的热备盘中的数据回写到替换后的新盘

查看回写进度的命令为:

/opt/MegaRAID/storcli/storcli64 /c0 /e252 /s2 show copyback

1337 查看回写进度的命令

8.2.9     Patrol Read相关指令与用法

预读(Patrol Read)是检查存储配置中的硬盘可能导致硬盘掉线或数据丢失的错误的一种操作。预读操作可以在系统访问之前发现并可能修复潜在的问题。此操作会提高系统的整体性能,因为如果在正常的IO操作过程中进行错误修复可能会对性能有影响。

 

1338 查看控制器预读信息

Ÿ     PR Mode:预读模式,有两种,分别为AutoManual

Ÿ     PR Execution Delay:自动预读时间间隔,默认为168小时,即一周;

Ÿ     PR iterations completed:预读执行次数;

Ÿ     PR Next Start time:下次预读启动时间,RAID控制器时间默认与系统时间同步;

Ÿ     PR on SSDSSD预读设置;

Ÿ     PR Current State:当前的预读状态,有Ready/Active/Paused/Aborted/Stopped/Unknown.

1339 关闭预读功能

 

1340 打开预读并设置模式为手动

 

1341 设置预读执行间隔,单位为小时

1342 开始预读

 

1343 暂停预读

 

1344 恢复已暂停预读

 

1345 停止预读

 

1346 设置预读占用RAID控制器资源比率

1347 查看预读占用RAID控制器资源比率

通过调整预读所占用RAID控制器的资源比率,能够调节预读的耗费时长与对系统读写性能的影响。比率越高,完成预读时长越短,对系统读写性能影响越大;比率越低,完成预读时长越长,对系统读写性能影响越小。

8.2.10     CC相关指令与用法

CC(Consistency Check,一致性校验),是校验有数据冗余功能的RAID组列所有条带的数据是否一致并且自动进行错误修复的一项操作。针对RAID1来说,此操作用来校正每个条带的镜像数据。

RAID0不支持进行CC操作。

1348 查看CC的具体信息

Ÿ     CC Operation Mode:一致性校验模式,有Sequential/Concurrent/Off

Ÿ     CC Execution Delay:一致性校验的时间间隔,默认为168小时,即一周;

Ÿ     CC Next Starttime: 一致性校验的下次启动时间;

Ÿ     CC Current State:当前一致性校验的状态;

Ÿ     CC Number of iterations:一致性校验的重复次数;

Ÿ     CC Number of VD Completed: 已完成一致性校验的虚拟硬盘的数量;

Ÿ     CC Excluded VDs:不执行一致性校验的虚拟硬盘。

1349 CC功能关闭

1350 CC设置为并发模式

 

1351 设置CC占用RAID控制器资源比率

通过调整CC所占用RAID控制器的资源比率,能够调节CC的耗费时长与对系统读写性能的影响。比率越高,完成CC时长越短,对系统读写性能影响越大;比率越低,完成CC时长越长,对系统读写性能影响越小。

1352 查看CC占用RAID控制器资源比率

 

1353 开始CC

注意,RAID组列创建完成后需要经过完全初始化后才可以进行一致性校验。完全初始化方法如下:

1354 开始完全初始化

 

1355 查看完全初始化进度

 

 

1356 暂停CC

 

 

1357 恢复暂停的CC

 

1358 停止CC

 

 

1359 查看CC的具体状态

8.3     LSI RAID卡日志搜集命令

服务器出现与RAID卡相关的故障时,需要搜集RAID卡的日志与状态信息,以供后台进行分析。搜集RAID卡日志的工具为storclistorcli工具针对不同操作系统有不同的版本,且storcliUEFI版本,所以如果系统死机或系统崩溃、需要进行RAID卡日志搜集,可将storcli工具拷贝至USB设备中,然后在BIOS下进入UEFI环境进行日志收集。

具体有如下命令:

控制器的详细信息

Ÿ     storcli /c0 show all

 

1360 查看控制器的详细信息

打印信息较多本文无法全部展示,使用该命令可以得到控制器的详细信息,实际使用时可将打印内容保存为单独文件(storcli /c0 show all>show-all.log)或使用grep命令根据关键字段搜索信息(storcli /c0 show all | grep 关键字段)

背板的详细信息

Ÿ     storcli /c0/eall show all

因打印信息较多,本文只截取部分内容以供展示。

 

1361 查看背板的详细信息

硬盘的详细信息

Ÿ     storcli /c0/eall/sall show all

该部分内容请参考11.2.4节。

查看RAID组列的详细信息

Ÿ     storcli /c0/vall show all

因打印信息较多,本文只截取部分内容以供展示。

 

1362 查看RAID组列的详细信息

查看RAIDFirmwareTermLog

Ÿ     storcli /c0 show termlog

因打印信息较多,本文只截取部分内容以供展示。

1363 查看RAIDFirmwareTermLog

查看RAIDalilog

Ÿ     storcli /c0 show alilog

因打印信息较多,本文只截取部分内容以供展示。

1364 查看RAIDalilog

查看RAID卡的Snapdump日志(仅限94xx及后续系列RAID卡可用)

Ÿ     使用storcli /cx show snapdump命令查看卡下有无Snapdump日志:

1365 查看RAIDalilog

Ÿ     若无日志使用storcli /cx get snapdump命令获取Snapdump日志

Ÿ     获取日志后,使用storcli /cx show snapdump命令查看Snapdump ID

1366 查看RAID卡下有无Snapdump日志

Ÿ     使用storcli /cx get snapdump id=<Snapdump ID > file=<filename.zip>命令获取Snapdump日志

查看链路的Phyerrorcounter

Ÿ     查看控制器端的指令是storcli /cx/pall show all,适用于LSIRAID控制器;

1367 查看控制器端Phyerrorcounter(1)

1368 查看控制器端Phyerrorcounter(2)

Ÿ     背板端的是storcli /cx/eall show phyerrorcounters,只适用于使用LSI Expander芯片的背板;

Ÿ     硬盘端是storcli /cx/eall/sall show phyerrorcounters,适用于SAS接口硬盘,SATA接口硬盘提示不支持此操作;

1369 SAS接口硬盘phyerrorcounter

1370 SATA接口硬盘phyerrorcounter

将以上日志搜集命令导出到文件保存,对RAID卡相关问题的分析具有重要的意义。许多问题可以通过日志追踪操作过程以及问题原因。在处理客户故障时,如果怀疑问题与RAID卡有关,建议在条件允许的情况下优先搜集日志信息。

8.4     固件刷写操作说明

刷新FW数据包有LinuxUEFI Shell下两种刷新方法,可依据实际情况选择刷新方式:

Linux下刷写

进入到Firmware所在路径, 执行/opt/MegaRAID/storcli/storcli64 /cx download file=fw_file;

fw_file为具体的Firmware文件名 (图片仅供参考)

1371 Linux下刷新FW数据包

等待刷新结束,刷新过程中注意不要断电;

刷新完成后重启,进入管理界面查看Firmware版本信息。

UEFI模式下刷写

进入BIOS,选择从UEFI: Build-in EFI Shell启动项启动,如下图所示:(图片仅供参考)

1372 进入Built-in EFI Shell

 输入命令“fs0:”,进入Firmware所在U盘;

进入Firmware所在路径。执行storcli.efi /c0 download file=fw_file noverchk;fw_file为具体的Firmware文件名(图片仅供参考)

1373进入Firmware所在路径

等待刷新结束,刷新过程中注意不要断电;

刷新完成后重启,进入SAS HBA卡管理界面查看Firmware版本。

 

新华三官网
联系我们