Eu sempre digo para os meus clientes que 5 é um número maldito. No meu primeiro DR (Não, não é Discutir a Relação, mas é quase tão ruim. Disaster Recovery para os menos íntimos, ou também, “não tinha como recuperar a base sem voltar o backup”) que eu passei ouvi a seguinte frase: “Mas em 5 anos nunca deu nenhum problema!”. Então comecei a perceber que 5 é um número que deveria preocupar as pessoas, pois atendi outros clientes com desastres justamente depois de 5 anos de produção com o mesmo equipamento.
Veja, um bom hardware é feito para trabalhar a plena carga por uns 3 anos. Hardwares excepcionais por 5 anos. No caso, o cliente tinha um SPARC rodando Solaris… mesmo assim um dia o storage da Sun (na época não tinha sido comprada pela Oracle ainda) apitou. E para a minha felicidade o backup físico não estava OK, voltamos um dump, foi lindo. Quase dois dias com a produção parada, um mega prejuízo para a empresa.
Recentemente um cliente me chamou para rever a infra dele, ou como dizem agora: fazer um health check. E lá eu encontrei um RAID 0 com o banco de dados nele. Coisa linda. Claro que eu sugeri desmontar o RAID 0. Mas o cliente disse que em 5 anos nunca tinha dado problema….
Semana passada o cliente me avisa que o RAID 0… pifou e ele perdeu todos os dados do RAID 0. Ainda bem que fiz ele colocar o SO e backup no RAID 0 e deixar os dados em outros discos. A perda foi menor, mas foi justamente depois de 5 anos!
Moral da história: hardware (principalmente discos) com 5 anos de operação em produção e RAID 0… tá pedindo para ter dor de cabeça! Mas hoje é sexta feira, dia de maldade…
OBS: testou seu backup recentemente?