A política de backup em um ambiente corporativo é de extrema importância quando desejamos manter uma infraestrutura sadia. Para se manter uma estruturação correta, as políticas de backup devem ser bem definidas, com testes de recuperação de dados e validação dos mesmos.
Em uma rotina de backup, possuímos algumas métricas utilizadas para medir a eficácia do processo. Dentre elas, estão o RPO e o RTO, mas o que significam estes termos?
O que é o RPO?
O RPO, ou Recovery Point Objective, é a margem de perda de dados que uma empresa pode assimilar, desde o ato do incidente até o ultimo backup realizado com sucesso, sem que isso ofenda as partes vitais de sua operação. Quando iniciamos um projeto de implantação de backup, tem de se ter em vista essa perda programada.
O RPO está ligado diretamente à periodicidade dos backups da empresa, conforme exemplo a seguir.
Imagine a seguinte linha do tempo, com dois períodos de 24 horas.
Seguindo o exemplo acima, a empresa possuí um banco de dados rodando no ambiente, e ocorre um desastre neste banco às 18:00 hrs. Não há como reverter o desastre, e a única solução é a restauração do Backup.
Neste cenário, é verificado quando foi feito o último backup, e no nosso caso, foi às 12:00 hrs. Com isso, todo o trabalho feito entre as 12:00 hrs e às 18:00 hrs foi perdido. Esse é o nosso RPO, 4 hrs.
Se a janela for muito grande, temos de analisar formas diferentes de se programar o backup diariamente, diminuindo assim a margem de perda de dados.
O que é o RTO?
O RTO, ou Recovery Time Objective, está relacionado ao período máximo de tempo que o sistema levará para voltar a operar após uma parada ou pane. Podemos incluir nesta parada toda a parte de planejamento, download e reinstalações das aplicações, até o momento na qual esta ficará disponível para o uso.
É um dado estimado, onde não se pode dar uma exatidão do tempo no qual a aplicação será reestabelecida, devido as diversas questões envolvidas. Este tempo pode ser diminuindo com uma gestão dos incidentes, procurando assim ferramentas e soluções ágeis para mitigar o tempo de parada da empresa.
Seguindo o exemplo da imagem anterior, o tempo de restore do banco de dados foi de 12 hrs, até a identificação do desastre e completa restauração do ambiente.
Neste processo, é necessário identificar e separar o que é dado importante e o que é dado relevante. Pode ser que todas as informações perdidas sejam necessárias, mas é necessário que haja um planejamento de qual informação é mais sensível para o funcionamento da empresa.
Ambos indicadores são de extrema importância dentro da corporação, enquanto o RPO tem como foco o ciclo de backups, o RTO atua no tempo em que o serviço será reestabelecido. Ambos precisam ser bem administrados para a plena saúde da empresa.
Conteudo muito bom e explicativo. Parabens