总结下最近作的一个项目,期间遇到不少问题,不过最后仍是成功解决了。数据库
一、光纤模块 安全
将A地的数据灾备到B地,中间相隔40千米左右,两端各有一个光纤交换机,A地是HP的,B地是Brocade的。不过HP的那个是OEM Brocade的。从一个厂商那买了几个单模的光模块,各插在两端的交换机上。结果发现不能通信。一开始怀疑是链路衰减,后来通过测试发现不是,再怀疑是模块的问题,但是模块厂家过来换了2次,仍是不通,结果模块厂商坚持认为是链路衰减的问题。后来就拖啊拖了1个多月(期间正好过年)。最后同事从北京公司换了个模块,问题成功解决。看来问题仍是出在模块身上。服务器
二、RAID降级ide
B地的管理服务器(安装SANtricity软件)启动时报错,出现degraded字样,进RAID卡调试发现作的RAID1,强行进入系统,没有问题。性能
三、HBA卡 测试
在管理服务器上用SANtricity软件指定一个卷,并将这个卷映射给主机后,发现主机不能识别,后来将光纤插到另外一个HBA卡上便可,原先那个HBA卡是坏的。spa
四、双控、多路径调试
因为存储是双控制器,而且两控制器都启用,所以主机链接存储的一个卷时默认会发现两个硬盘,在主机层配置多路径便可。若是存储厂商不提供多路径软件,主机使用开源或免费的便可。 ci
五、HBA卡驱动文档
主机经过光纤链接存储,走FC协议,所以需配置HBA卡,而且在主机上安装HBA卡的驱动
六、集群文件系统
A地主机实现Oracle双机,使用同一个存储卷,走FC协议,结果主机方面的集成商说之前从未遇到过,只会作NAS方式的。我推荐他们用OCFS实现卷共享,他们说不安全。。。。我无语了,继续推荐他们用其余集群文件系统。后来涉及到费用问题,他们仍是乖乖的用OCFS了。
七、NAS机头
仍是上面那个问题,客户的技术人员说既然没法实现卷共享,那就在存储前面加一个NAS机头。可是NAS机头价格比集群文件系统软件贵,并且用于数据库环境性能会变差。
八、镜像卷及切换
A地的A卷和B地的B卷作镜像关系,当A卷发生改变时,能当即反应到B卷。这样万一A卷故障,便可先中止他们的镜像关系,而后将B卷挂载便可。
九、Solaris
B地的主机是Solaris,集成商不太懂,现场用手机各类查啊,好比查看HBA卡的WWN号,对磁盘格式化分区,多路径配置等等。
十、项目验收
客户提出须要找第三方公司作A地同步到B地的性能测试,Oh my God。。。
总结:
(1)、项目中遇到屡次是硬件设备的故障,例如光纤盒HBA卡,当出现问题时,千万不能一根筋,要从各个方面去排查,大胆尝试,当心求证。
(2)、事先要准备好相关的实施资料,包括设备驱动、用到的软件、相关系统和设备的使用手册,不怕一万就怕万一。
(3)、作售前或售后,不要求你像研发那样精通到底层协议,可是要涉及的知识面要广,从主机到应用再到存储都要懂。
(4)、该你作的你就作,不应你作的你能够帮助,提供建议或文档,可是不要本身去动手作,否则出了问题就头大了。