金沙4166

XML 地图 | Sitemap 地图
金沙4166> 行业资讯> 数据中心存储系统出现故障应该从这几个方面入手
?

数据中心存储系统出现故障应该从这几个方面入手

2018/11/6 17:06:19 | 来源:www.usa-idc.com

存储系统作为如今大数据云计算时代的根基,它的稳定才是支撑起如此海量数据的根本。所以各大相干行业对于这局部非常重视,所以在此针对存储系统的故障处置简单提议自己学习回顾的一些思路。

首先在处理存储系统产生的或许故障前必须对于整个存储系统的架构以及原理有一个清楚的了解。普遍来说存储系统由主机、交换机及存储设备组成。它们之间可以是直连或者是IP网络或FC网络的方式实行连接。整个系统的稳定性跟每个组成局部都息息相干。

其次了解故障的分类

,故障分类大致分为硬件故障、配置故障或者license类问题,先外部后内部,先处理高级警告后处理低级警告,先共性后个性。面对故障的产生,第一步永远都是先实行必要的讯息收集,对于整个存储系统的根本讯息,故障讯息、存储设备讯息以及组网、主机办事器讯息要有了解。这些局部可以直接办理到主机、交换机或存储设备中实行收集,如今厂商也都有专门研发维护工具来帮助办理者做这些事情。收集清楚这些讯息之后,才能对整个存储系统有一个普遍清晰的认知。至少对如今的故障或许产生原因有一个了解,然后再细化到每个组成局部上排查或许问题。

一、主机层

在主机层面大多需要检查的是操纵系统版本,相符合的HBA卡是否达到合适的标准,如速率、IOPS及带宽等。其次是在主机上安装的多路径App,查看一下与存储设备连接的物理路径的状态以及存储LUN等讯息。

二、网络层

网络层次或许产生的问题大多是连通性问题,由于链路故障导致的丢包或者误码率上升等现象,此现象可以在交换机上观察端口的讯息,观察误码率是否在持续增长,如有,则或许存在链路部件异常或接触不良的现象。其次或许是端口速率或带宽未达到标准,查看端口配置及协商情况,这些都有或许导致故障或者性能问题。

三、存储层

存储设备可以在导出相干告警,事件或者运转数据、系统日志和硬盘日志来进一步剖析或许产生故障的原因,到底是存储控制器问题还是底层的硬盘问题都需要一一排查。在底层存储方面首要考虑存储模块的配置,指示灯状态等讯息,从指示灯状态大家可以剖析出是否存在硬件故障等,其次在配置方面:RAID级别、分条深度、LUN读写策略、cache策略,LUN归属、硬盘类型等是否符合业务的特点以及不符合时或许导致的问题。都是需要大家在故障排查处理时需要考虑的。

总之面对存储系统的故障,一定要具备一个清晰的思路,不要盲目的去做。盲目的去做或许会恶化故障,从而使得排查难度进一步加大。

金沙4166运营部编稿

猜你喜欢

金沙4166为您的网站提供全球顶级IDC资源
在线咨询
24H在线QQ
400-6866-820
24H免费热线
400-6866-820
Copyright @2005 - 2018 粤ICP备13012552号-3 增值电信业务经营许可证:粤B2-20090095
在线咨询
在线客服


7X24小时在线QQ

免费电话:
400-6866-820

最新活动
XML 地图 | Sitemap 地图