Indisponibilidade dos serviços da SALESFORCE

Indisponibilidade dos serviços da SALESFORCE no mundo por mais de 3 dias

Histórico

Indisponibilidade dos serviços da SALESFORCE

Clientes no Brasil também foram afetados, principalmente nas cidades de São Paulo e Rio de Janeiro.

Na sexta-feira 17/05/19, por volta das 14:00 hs. horário de Brasília, ocorreu um problema de acesso nos serviços da Salesforce permitindo que empresas acessassem informações de outras empresas.   Este problema que afetou os usuários no mundo todo ainda não havia sido totalmente corrigido no momento que este post foi escrito.   Leia também em “Salesforce suffers major outagehttps://www.datacenterdynamics.com/news/salesforce-suffers-major-outage/” e em Salesforce? Salesfarce: Cloud giant in multi-hour meltdown after database blunder grants users access to all datahttps://www.theregister.co.uk/2019/05/17/salesforce_database_outage/

Segundo o seu próprio site, “a Salesforce é a empresa inovadora por trás da plataforma de CRM nº 1 do mundo. Nosso software é baseado em nuvem e por isso não requer uma equipe de especialistas de TI que o configure ou gerencie; basta fazer login e começar a usar”.

Indisponibilidade dos serviços da SALESFORCE

Instâncias que ficaram indisponíveis

Este tipo de problema só acontece na “nuvem”?

A indisponibilidade dos serviços da SALESFORCE é um problema que poderia ter acontecido com qualquer outro serviço de TI na “nuvem” ou não, isto é, sendo executado no Data Center das próprias empresas.

Normalmente, empresas implantam uma estrutura de recuperação de desastres – Disaster Recovery – preocupadas com a possibilidade de um incidente físico que afete as instalações do Data Center principal de produção, por exemplo: um incêndio ou como no caso deste Data Center no Rio de Janeiro alagado pelas chuvas torrenciais de Abril/19 – https://strohlbrasil.com.br/e-se-acontecer-o-que-vamos-fazer-urgente/

Mas, e quando a natureza do problema não é física e sim lógica ou de segurança como neste caso?

Antes de prosseguirmos vamos a uma rápida explicação.

Todos estes dados ou informações armazenadas por estes aplicativos, sistemas ou serviços ficam armazenados fisicamente em algum tipo de equipamento de armazenamento de dados.   Como qualquer tipo de equipamento este também está sujeito a falhas, razão pela qual podemos usar um outro equipamento semelhante como contingência no próprio local – Data Center ou em outro local – Disaster Recovery.

Indisponibilidade dos serviços da SALESFORCE

Duração da indisponibilidade até o momento deste post

Nos dias de hoje, estes dados ou informações estão organizados em estruturas lógicas – Bancos de Dados.   Estas estruturas de dados devem ter controles de acesso, por exemplo: determinados usuários podem ler e escrever, outros somente escrever e outros – os administradores – podem definir e alterar todas estas regras de acesso.   Estes bancos de dados podem ser muito pequenos e simples, portanto fáceis de manipular e recuperar, se necessário, ou muito grandes e complexos, muito difíceis de manipular e recuperar.

A causa do problema foi um “script” errado

Voltando ao texto do nosso post, pelas informações públicas disponíveis, a indisponibilidade dos serviços da SALESFORCE foi decorrente de uma manutenção realizada  nos controles de acesso do banco de dados que foram, inadvertidamente, alterados permitindo que usuários de uma empresa tivessem acesso às informações de outra empresa.

O problema foi percebido algum tempo depois e aí a Salesforce tinha que tomar uma decisão: ou restaurar os backups – que devem existir – e assumir uma determinada perda de dados aos seus clientes ou restaurar os controles de acesso.   Leia mais sobre backups e perda de dados em https://strohlbrasil.com.br/conceitos-basicos-por-que-fazer-backups/

Corrigir o problema ou restaurar os back ups?

Não sabemos por que a decisão foi pela restauração dos controles de acesso mas as consequências são de 3 dias de indisponibilidade, até o momento que este post foi escrito.   Restaurar os backups seria mais rápido?   Não temos informações para responder.   Estimamos que estes bancos de dados sejam muito grandes o que levaria dias para a sua restauração além da perda de dados, que poderia ser muito impactante para determinados clientes da Salesforce.

É para situações como esta que os conceitos de resiliência devem ser estressados tanto do lado do prestador do serviço, seja interno ou externo, e do lado do tomador do serviço.

O prestador de serviço deve desenvolver várias estratégias para, antes de mais nada, tentar evitar que o problema ocorra e depois restaurar o mais rapidamente o serviço prestado.   Enquanto o tomador de serviço deve desenvolver estratégias para manter o seu serviço operando, num determinado nível de sobrevivência, assumindo que as estratégias do prestador de serviço não serão efetivas.

Situações como esta são apresentadas e discutidas no nosso curso de Imersão na Gestão da Continuidade de Negócios – https://strohlbrasil.com.br/imersao-na-gestao-da-continuidade-de-negocios/

Leia mais sobre resiliência em https://strohlbrasil.com.br/resiliencia-uma-jornada-ou-um-destino/

Lembre-se sempre das sábias palavras de Clark que dizia que “Murphy era um otimista”. (https://www.todamateria.com.br/lei-de-murphy/)

Quer saber mais sobre os nossos serviços e cursos de Continuidade de Negócios?   Por favor preencha o formulário abaixo.

1 Trackbacks & Pingbacks

  1. Ainda a indisponibilidade da SALESFORCE - STROHL Brasil

Comments are closed.