Eu já perdi as contas de quantas vezes me deparei com essa pergunta. Por ser um item muito abordado na ITIL, deveria sim ser algo mais comum entre a vida dos profissionais de TI, porém existem muitas dúvidas desse assunto por aí.
Problema: A palavra já diz tudo, é um problema. Sabe aquele software que foi para a produção mesmo após ter sido identificado um bug em homologação? O tempo era curto para arrumar, então vamos arrumá-lo em produção.
Um outro exemplo mais fácil de entender. Sabe aquela luz insistente que acende no painel do seu carro todos os dias que você nunca teve interesse em averiguar, e de repente seu carro para no meio da rodovia por que era um problema no motor? Isso não é um incidente, e sim um problema. Mas por que, se só aconteceu uma vez?
Não é porque ele aconteceu uma única vez, ele é um incidente. Neste caso, havia avisos de manutenção necessárias, que foram ignorados. A mesma coisa acontece se você possuir um servidor com Windows Server 2012, e ele sofrer ataque. Quantas vezes a Microsoft não lhe disse que não havia mais atualização?
Por mais que um problema seja identificado sempre após um incidente, não são todos os casos que isso acontece. Existem exemplos iguais os anteriores que provam isso.
Incidente: Agora que você já entendeu o que é um problema, ficou mais fácil saber o que é um incidente? Talvez não.
Um incidente é sempre o evento que interrompe os serviços uma única vez. Se aconteceu 2 vezes, tornou-se um problema. Na ITIL, o gerenciamento de incidentes é o processo responsável por garantir a restauração rápida de um serviço de TI, garantindo um impacto menor, já o gerenciamento de problemas vai tratar a fundo evitando que ocorra novamente.
Mais alguns exemplos, para você entender mesmo
Baixo desempenho de hardware: Problema! Antes de implantar um hardware, é necessário que seja analisado se ele atende as expectativas de uso. E quando isso não acontece, você com certeza vai presenciar vários problemas de uso no dia a dia.
Excluir acidentalmente um arquivo: Incidente! O arquivo foi excluído pelo usuário por acidente, gerando perda de dados. O gerenciamento de incidentes nesse caso, irá restaurar o arquivo, e normalizar o uso. O gerenciamento de problemas irá analisar depois soluções para contorto definitivo desse problema. Será que a permissão desse usuário deveria ser reduzida? Entre outras situações bem típicas.
Switch travou, toda a operação parou: Primeira vez que acontece? Incidente. Após a correção analisar o caso. Travou denovo, problema. Switch com defeito, ou algum problema de energia está gerando impactos no equipamento.
Não é difícil descobrir o que é problema, e o que não é. Lembre-se de que sempre algo que possa parar a empresa surgir, faça a pergunta: Quantas vezes isso já aconteceu? Se for a primeira, trate como incidente. Se for a segunda ou mais, você tem um problema em mãos.
Seja o primeiro a comentar