Se alguma coisa pode dar errado, dará!

Se alguma coisa pode dar errado, dará!A frase “Se alguma coisa pode dar errado, dará! é uma das inúmeras variações da famosa Lei de Murphy, “If anything can go wrong, it will”.   Depois desta lei veio outra não tão famosa, a Lei de Clark que afirma que “Murphy era um otimista”.

Estas “leis”, que talvez não sejam possíveis comprovar cientificamente, se manifestam com frequência no mundo real.   Conforme postagem do DatacenterDynamics (https://www.datacenterdynamics.com/news/widespread-wells-fargo-outage-blamed-data-center-fire/) foi o que aconteceu com o banco Wells Fargo nos Estados Unidos.

Informações não confirmadas (e possivelmente jamais o serão) indicam que no dia 07/02/19 o disparo do sistema de combate a incêndio em dos Data Centers do banco provocou a interrupção dos serviços nos demais Data Centers indisponibilizando todos os serviços de TI do banco por pelo menos dois dias.   E, como alertava Clark, estruturas “fail over” que não deveriam falhar, não funcionaram como esperado.

Há pelo menos três versões para o disparo do sistema de combate a incêndios.

A primeira é que houve um princípio de incêndio o que é negado pelo Corpo de Bombeiros local.

A segunda que houve uma queda de energia elétrica, os geradores não entraram em operação e dois teriam incendiado espalhando muita fumaça.   A versão de um  incêndio é corroborada por vários cidadãos locais.

A terceira que por conta de uma manutenção muita poeira foi espalhada e esta poeira teria ativado o sistema de combate a incêndios.

Em um comentário o Wells Fargo afirma “ter sofrido indisponibilidades devido à falta de energia elétrica em um de seus Data Centers após fumaça ser detectada decorrente de manutenção de rotina”.

Outra informação não confirmada é que equipamentos, exceto de telecomunicações “core”, tiveram que ser fisicamente desconectados na rede elétrica para permitir o “power on” controlado.

Se alguma coisa pode dar errado, dará!

A indisponibilidade deste Data Center “derrubou” os demais Data Centers do banco.   O banco emitiu uma nota dizendo que “foi um evento localizado em um dos seus locais de operação e não devido a um incidente cibernético”.   O banco não emitiu nenhuma nota sobre as reais causas do incidente nem porque os demais Data Centers também pararam ao invés de assumir os serviços do primeiro Data Center (#disasterrecovery, #recuperacaodedesastres).

Em 01/02/19 o banco já havia sofrido outra grande indisponibilidade.   Segundo o site de monitoramento DownDetector o banco Wells Fargo teve pelo menos 40 indisponibilidades, de diferentes durações, em 2019 (https://downdetector.com/status/wells-fargo/archive/).

Não é incomum sistemas de combate a incêndios provocarem interrupções.   Vejamos algumas:

Qualquer sistema, por mais protegido que seja, é passível de falhas, decorrentes de: projetos deficientes, falhas na manutenção, erros de operação, utilização fora das especificações de projeto, outros eventos externos fora do controle etc.

Então, como previa Murphy, “Se alguma coisa pode dar errado, dará!” e, como alertou ClarkMurphy era um otimistaou seja, além de acontecer as falhas serão piores do que as previsões.

Quer saber mais sobre os cursos e os serviços de continuidade de negócios e/ou recuperação de desastres da STROHL Brasil?  Preencha o formulário abaixo e entraremos em contato.