首先华为存储故障被华为官方声明为网上不实传闻。昨天有消息说华为存储控制器故障,以及用户负责人被降级的消息,被华为官方指出是一个不实的消息!
不管亲们信还是不信,华为官方微信号内容如下,虽然没有具体提及用户名字,也没有提及具体事情,但阿明猜想应该是同一件事情,如果是阿明猜错了,亲们再指正,所以必须贴出来给各位亲看看,:
其次,纯粹从技术角度来分析,《双活可能是条沟,由华为存储故障引发的思考!》中Dostorage的评论引用冬瓜头的内容有问题。为什么呢?被华为官方证实为不实的那条消息中,提及华为控制器双活技术问题,没有提到数据中心存储双活,冬瓜哥写过那篇叫双活都是坑,主要讲数据中心的存储双活。因此,Dostorage评论显得并不专业。
需要各位亲明白一个概念:控制器双活只是存储单系统单机内部,比如双控双活中一个控制器坏了,另一个控制器可以接管,并且一般都会有冗余备份;而存储双活是针对数据中心环境,两者概念可不能混淆,否则会出乱子的。
好吧,既然华为官方说华为存储没有出现控制器双活的技术问题,那么用户在实际应用过程中,到底针对双活控制器有哪些需要注意的问题呢?
对于这个问题的讨论,阿明建议亲读一读【冬瓜哥手绘】从多控缓存管理到集群锁的这篇文章。里面涉及的知识点和策略都比较详细。
另外针对数据中心双活与灾备问题,也可以读一读【冬瓜哥画PPT】——双活是个坑!这个内容深入浅出,比较适合知识积累和学习。
昨天,阿明在与多位存储业界专业人士求证之后,明白一个问题:控制器双活在高压情况下,免不了会遇到低概率事件,一旦碰到,用户只有崩溃的份儿,因此,对于用户来说,到底选择什么样的存储架构,到底要不要结合存储与灾备来规划,这都是摆在用户面前的实际问题。
由此分析,不管存储厂商是否存在双活控制器遭遇低概率事件引发故障的问题,作为用户来说,最好的选择,还是在一个稳定的、经过时间检验的、有着一定历史与用户长期使用的存储平台上做文章,似乎更为稳妥一些。(阿明)
来源:阿明自媒体微信公众号chinastor