Incêndio atingiu a BRDigital

Incêndio atingiu a BRDigital em Porto Alegre/RS – Deus perdoa mas a Internet não

Incêndio atinge a BRDigital em Porto Alegre/RS

Tema sugerido por vários de nossos leitores, lamentamos não poder nominar todos.

No dia 06/03 um incêndio atingiu um dos Data Centers da empresa BRDigital localizado na cidade de Porto Alegre, RS indisponibilizando os serviços para seus clientes.   Este incidente de interrupção praticamente não teve repercussão na mídia nacional, somente algum destaque na mídia local (https://www.baguete.com.br/noticias/07/03/2018/brdigital-atingida-por-incendio)

Por outro lado, no dia seguinte, tão logo o edifício foi liberado para a entrada de pessoas, quase que na velocidade da luz, começaram a circular nas mídias sociais, grupos no Facebook, Whatsapp e até mesmo no LinkedIn várias fotos, supostamente do interior do Data Center, e posts com comentários de inúmeros “especialistas” incriminando, julgando e sentenciando a BRDigital, comportamento comum das mídias sociais e das “fake News” que só servem para realimentar a crise, que não é pequena.

No dia 13/03 sai a primeira notícia depois do incêndio que atingiu a BRDigital com a entrevista do sey diretor de negócios (https://www.baguete.com.br/noticias/13/03/2018/brdigital-depois-do-incendio) dando a sua versão para o incêndio.   Pelo que pesquisamos, este foi o primeiro pronunciamento público da empresa nas mídias, exceto o primeiro comunicado feito no dia do incêndio, ou seja uma semana após.

Bem, vamos a uma curta análise deste incidente, baseada nas notícias divulgadas, as quais pudemos comprovar a sua veracidade, e no conhecimento e experiência da STROHL Brasil em prevenção, resposta gestão de incidentes e crises, e em planos de recuperação de desastres e de continuidade de negócios.

Fato 1:

houve um incêndio, de pequenas proporções, e não um “princípio de incêndio” no Data Center como inicialmente divulgado.

Fato 2:

os bombeiros chegaram evacuaram e desligaram a energia do edifício”.   Desligar a energia do edifício é um procedimento padrão dos Bombeiros.   Causa estranheza ter aguardado a chegada dos Bombeiros para evacuar o edifício.   O procedimento correto seria ao ser acionado o alarme de incêndio da BRDigital haver o acionamento do alarme de incêndio do edifício e iniciar imediatamente a sua evacuação.   Ou seja, estar em condomínio significa herdar o risco de todos os demais condôminos, independentemente do seu grau de preparação.   A mesma coisa vale para os edifícios adjacentes.

Fato 3:

segundo o diretor de negócios “o sistema de combate a incêndios funcionou adequadamente” e ainda, segundo ele, “nem todas as fotos divulgadas eram do interior da BRDigital”, o que quer dizer que algumas seriam.   Às fotos que tivemos acesso, e que não pudemos comprovar a veracidade, são de um incêndio intenso que não pode ser controlado pelo sistema de combate instalado.   Um sistema com VESDA (Very Early Smoke Detection Apparatus) é capaz de detectar princípios de incêndio em estágios muito iniciais, o que, interligado a um sistema de combate a incêndios a gás (FM200, Inergen, Novec etc.) operando em modo automático e um sistema automático de desligamento da energia elétrica reduziria, significativamente, os danos subsequentes.   O que observamos nas nossas avaliações de risco são os sistemas de combate a incêndios operando em modo manual e a inexistência do sistema interligado de desligamento da energia elétrica implicando numa resposta ao incidente mais demorada e consequentemente em maiores danos.

Ainda, citam as notícias, que o “fogo começou em dois dos 50 racks” instalados naquele data center.   Bem, sempre pode ocorrer um curto circuito decorrente de uma falha em algum componente, mas o mais comum é uma sobrecarga elétrica, numa régua por exemplo, muito comuns dentro dos racks, causando o princípio de incêndio por aquecimento.   Situações deste tipo são facilmente identificadas mediante termografias nos quadros e conexões elétricas, o que também, infelizmente, não encontramos com frequência nas nossas avaliações de risco.

Fatos 4:

os serviços prestados a todos os clientes da BRDigital, naquele data center, ficaram indisponíveis até que a energia elétrica pode ser restabelecida, os equipamentos religados em segurança e os servidores e bancos de dados tenham terminado os seus procedimentos de “fall back” ou “recovery backwards”.   É muito provável que dados eletrônicos foram perdidos definitivamente obrigando os clientes a realizarem procedimentos de conciliação, por exemplo, para assegurar a consistência e integridade das informações disponibilizadas.   Esta atividade de conciliação deveria ser parte do plano de continuidade de negócios das empresas clientes da BRDigital.

Fato 5:

os serviços que dependiam dos racks danificados pelo incêndio, que não sabemos no total quantos foram afetados diretamente pelo fogo e indiretamente pelo calor e a fumaça, ficaram e continuarão indisponíveis até que novos racks, servidores etc. tenham sido restabelecidos.   Se esta recuperação depender da compra e entrega de equipamentos novos este prazo, mesmo em regime de urgência, pode levar várias semanas até meses.   E se o equipamento, pelo contrário, for obsoleto e não pode ser reposto, devido a uma incompatibilidade do hardware com o sistema operacional com a aplicação, esta recuperação, se possível, poderá demorar meses até que conseguir de algum lugar uma máquina velha ou migrar todo o serviço para uma plataforma mais moderna.

Fato 6:

infelizmente, incidentes em data centers não são tão incomuns assim.   Basta uma rápida pesquisa usando “data center fire” ou “incêndio em data center” para encontrarmos vários destes eventos, nacionais e internacionais.   Isto somente procurando por incêndio, existem muitas outras causas de indisponibilidades em data centers.

Fato 7:

imagens internas do data center foram divulgadas fato admito pelo diretor de negócios ao dizer “nem todas as fotos divulgadas eram do interior da BRDigital”.   Quem divulgou?   Como foram obtidas?   E a segurança patrimonial e da informação estavam fazendo o que permitiram isso?

Infelizmente, pelo que pudemos apurar, nem todos os clientes afetados tinham, no mínimo o DRP, ou porque assumiram o risco, ou por acreditarem que por terem contratado um serviço num terceiro, ou na “nuvem”, o risco estaria eliminado.   Para situações de risco como esta, de muito baixa probabilidade mas de muito alto impacto, é que existe o DRP – Disaster Recovery Plan e o PCN – Plano de Continuidade de Negócios.

Mas, se você optou por assumir o risco não fazendo nada lembre-se: “DEUS PERDOA, MAS A INTERNET NÃO.”

Quer saber mais sobre os serviços e cursos de Continuidade de Negócios da STROHL Brasil?   Por favor preencha o formulário abaixo.