O dia que a nuvem pegou fogo

O dia que a nuvem pegou fogo

Histórico
O dia que a nuvem pegou fogo
Detalhe do bombeiro e o jato d´água no data center

No nosso post de 10/03/21 divulgamos na seção NEWS da nossa newsletter semanal o incêndio no data center da empresa OVH localizado na cidade de Estrasburgo, França principalmente no serviço de nuvem OVHCloud.

Como muitos data centers pelo mundo este era composto por 4 blocos SBG1, 2, 3 e 4.

O SBG1 teve alguns corredores de racks destruídos, o SBG2 foi totalmente destruído e o SBG3 e SBG4 foram desligados por medida de segurança embora possam ter sido afetados pelo calor e fumaça dos outros blocos.

O risco residual

Temos alertado, sistematicamente, que contratar serviços na nuvem nada mais é do que contratar serviços no data center de um terceiro potencialmente sujeitos aos mesmos riscos que qualquer data center doméstico.

Alguns poderão argumentar que a afirmação acima não é totalmente verdadeira com o que concordamos parcialmente.   Em uma ponta na escala há data centers profissionais com excelente infraestrutura, muito superiores a maioria dos data centers domésticos, com certificações Tier III ou IV do Uptime Institute, sofisticados sistemas de prevenção e combate a incêndios, redundância tripla ou quadrupla de energia elétrica, inúmeras certificações de gestão de TI e de segurança de TI etc.

Na outra ponta da escala há muitos data centers sem certificação alguma obedecendo a máxima “You get what you pay” com infraestruturas muito inferiores a data centers domésticos.

O começo do incêndio

Segundo pesquisamos o data center da empresa OVH localizado na cidade de Estrasburgo, França não tinha certificação do Uptime Institute e ao que tudo indica o incêndio teria começado no sistema de nobreak o que não é nenhuma surpresa.   Incêndios em data centers começam, geralmente, na infraestrutura de energia elétrica – subestação, cabine primária, transformadores, geradores ou nobreaks; ou no sistema de refrigeração embora possam ocorrer, menos frequentemente, nos racks de equipamentos.

O que é estranho neste incêndio é as proporções que tomou indicando que todo o sistema de prevenção, detecção e combate a incêndios não funcionou adequadamente.   O sistema poderia estar em modo manual dependendo de uma intervenção humana para acioná-lo, o que é muito frequente, e não no modo automático.   A quarentena da covid-19 pode ter reduzido significativamente a quantidade de operadores “on site” que poderiam ter iniciado as primeiras ações de resposta na madrugada do dia 10/03/21.

Assumindo que o incêndio tenha iniciado no sistema de nobreak e atingiu os blocos dos servidores isto significa que o estas infraestruturas estão muito próximas, uma enorme falha de projeto.

Bottom line

Uma semana depois do incêndio os serviços na nuvem da OVHCloud ainda não foram reiniciados.

Estimativas apontam que mais de 3,6 milhões de sites estão indisponíveis, embora o da OVHCloud esteja no ar.

O sistema de nobreak, baterias e fusíveis foram entregues à polícia local e para a companhia de seguros para investigação, o que é absolutamente normal.

O fundador da OVH, Sr. Octave Klaba, promete políticas melhores de backup para o serviço na nuvem OVHCloud no futuro (ficaríamos surpresos se fosse no passado!) e gratuitas.   Em post no Twitter o Sr. Klaba também cita a surpresa de seus clientes por terem perdidos dados, muitos definitivamente.

Muitos clientes assumem, incorretamente, que por terem contratado serviços na nuvem seus dados serão backupeados pelo prestador de serviços.   A Google deixa muito claro no seu contrato de serviços que é responsabilidade do cliente fazer os backups, e os testes de restore, dos seus dados.

Espere que ainda tem mais

Em 06/03/18 um dos data centers da BRDigital no Brasil também pegou fogo na cidade de Porto Alegre, RS, deixando vários serviços, inclusive do governo, indisponíveis por vários dias.

No dia 09/03/21 o data center da NOAA – National Oceanic and Atmospheric Administration utilizado para processar dados originados nas boias marítimas e antecipar a ocorrência de tempestades e furacões sofre uma inundação devido a dano numa tubulação.   Até a data de edição deste post (17/03/21) os serviços ainda não haviam sido restabelecidos.

No dia 16/03/21 o Active Directory da Microsoft Azure sofreu uma pane provocando indisponibilidades nos serviços do Teams, Office 365, Xbox e Dynamics.

Parece que a bruxa está solta e voando por aí até na nuvem.

Quer saber mais sobre como implantar Resposta a Incidentes e Emergências, Gestão de Crise, ou Programa de Continuidade dos Negócios completo?     Por favor, preencha o formulário abaixo e entraremos em contato.

#businesscontinuity     #continuidadedenegocios     #crisis     #outage     #OVH     #OVHCloud     #resilience     #DRP

 

Compartilhe este Artigo

Compartilhar no email
Compartilhar no facebook
Compartilhar no twitter
Compartilhar no linkedin
Compartilhar no whatsapp

Artigos Relacionados

O dia que a nuvem pegou fogo

O dia que a nuvem pegou fogo Conteúdo ocultar O dia que a nuvem pegou fogo Histórico O risco residual O começo do incêndio Bottom

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Este site utiliza cookies para proporcionar uma melhor experiência para nossos usuários. Ao continuar a navegação neste site, você estará de acordo com os cookies que estão sendo utilizados. Se quiser saber mais sobre nossa política de cookies, clique aqui.