Em ITIL (Information Technology Infrastructure Library), o processo que é mais exigente em termos de alcançar o sucesso de entrega é de gerenciamento de problemas. O resultado deste processo não é simples como alguns dos outros que eu tenho discutido até agora. As atividades realizadas aqui envolvem a investigar o problema na mão, encontrar o culpado e meting uma decisão para resolver o problema.
Isso soa muito como o Crime Scene Investigation (CSI) revela que vemos na televisão, que envolve muita investigação, seguindo as pistas e precisão pino apontando o responsável. Meu favorito pessoal é a versão de Miami.
O perito que vemos na televisão é encenado e na versão real da investigação forense leva vários dias e meses para alcançar o sucesso razoável. Os temas são pessoas reais, evidências deixadas para trás durante o ato informação de fundo, e conexões. Em TI forma de CSI – gerenciamento de problemas, as investigações são muito semelhantes. Trata-se de investigar e sondar os técnicos envolvidos, estudando os arquivos de log e da história da infra-estrutura em causa e da análise minuciosa da arquitetura para os possíveis problemas relacionados. Você não sente gestão problema poderia ser divertido? Definitivamente, eu comecei minha carreira fazendo gestão de problemas pelo caminho.
O que é considerado um problema?
“Problema” é uma linguagem comum para as pessoas em toda as profissões e as sociedades. Em TI, é preciso ter cuidado quando usamos este termo como ele carrega muito peso. Um “problema” em ITIL refere-se a um incidente do qual não sabemos a causa raiz ou ainda uma questão que é de natureza repetitiva, sem solução à vista.
A definição oficial, conforme definido pelo ITIL é:
A causa raiz desconhecida de um ou mais incidentes existentes ou potenciais. Problemas podem às vezes ser identificado por causa de vários incidentes que apresentam sintomas comuns. Problemas também podem ser identificados a partir de um único incidente significativo, indicativo de um único erro, para que a causa é desconhecida. Ocasionalmente, problemas serão identificados bem antes de qualquer incidente relacionado ocorrer.
Vamos dar um exemplo. Você está usando o MS Outlook 2007 e quando você tenta abri-lo, o Windows gera uma mensagem de erro e, aparentemente, você não pode abrir o aplicativo. Bem, este é um incidente. O técnico olha para o seu sistema e não pode identificar o culpado e decide desinstalar e reinstalar o software, não vá. A questão ressurge, mesmo depois de reinstalar. Neste caso, a causa é desconhecida e, portanto, o Outlook 2007 problema pode ser denominado como um problema.
O técnico aumenta o problema para o próximo nível de suporte. Quanto maior o técnico qualificado olha para o seu sistema, lê-se através de várias páginas de documentação, refere-se a bases de conhecimento e encontra a solução para o problema. Ele imediatamente vai para o registro e muda um parâmetro que estava em conflito com o MS Outlook 2007, e voila que corrige o problema. O incidente foi resolvido e agora o problema, cuja causa raiz é estabelecido, torna-se um erro conhecido.
Solução alternativa temporária e permanente
Soluções Temporária e Permanente soluções são as duas variedades de correções de encontrar no mundo da TI. Enquanto ambos não podem e não existem mutuamente, elas são usadas em justaposição, mas não simultaneamente.
Uma solução temporária é uma correção que é fornecida a um problema na mão, mas a correção fornecida não é permanente. Se o MS Word no seu PC não está funcionando, o download do Open Office e, em vez de usá-lo é uma solução, mas é em nenhum sentido, a solução é óptima. Entretanto, se você seguiu em frente e reparou MS Word utilizando as técnicas de resolução de problemas necessárias e interposição do recurso de volta à vida, que poderia ser mais ou menos, ser considerada uma solução permanente.
Observe que quando você teve seu reparo provisório no local, você pode começar o trabalho feito, mas não exatamente da maneira / significa que se destina. Ela serviu apenas o propósito de obter-lhe através de momento. Quando você optou por uma solução permanente, você não precisa mais de uma solução temporária, embora possa ainda existir no sistema.
Uma solução temporária é geralmente uma saída de gerenciamento de incidentes, enquanto solução permanente é sempre o objetivo do gerenciamento de problemas, embora eu não iria no registro indicando que tudo o que sai da gestão do problema é de natureza permanente.
Análise de Causa Raiz (RCA)
O Root Cause Analysis (RCA) é um documento / relatório que é resultado de gerenciamento de problemas. O objetivo deste documento é estabelecer a causa raiz do problema e encontrar uma solução permanente.
A RCA típicas listas com os detalhes do problema, tais como a natureza da interrupção, prazo, as regiões afetadas, entre outros fatos. Além disso, teria uma seção inteira dedicada à descoberta da causa e as medidas tomadas para resolvê-lo. Finalmente, uma medida preventiva para garantir a questão não aconteça novamente é recomendado.
Aqui estão algumas amostras RCA .
Para encontrar a causa de um problema, existem várias técnicas de problema de gestão em vigor. O mais simples e, possivelmente, a técnica mais comumente utilizada é a 5 por análise. Basta fazer a pergunta ‘por que’ cinco vezes consecutivas. Deixe-me ilustrar com um exemplo.
Vamos dizer que o teclado que é conectado ao seu PC não está funcionando. Aqui estão as perguntas e as respostas que eu colocaria para chegar a causa raiz.
- Porque é que o teclado está funcionando? Windows 7 não reconhecê-lo.
- Por que o Windows 7 não reconhece o teclado? Driver é corrupto.
- Porque é que o driver corrompido? Maggie tentou instalar o seu teclado sem fio no PC. Ela instalou os drivers do teclado sem fio para este PC.
Aqui você vai. Driver conflito é a causa raiz desse problema. Você realmente não tem que ir até perguntando “porquê” cinco vezes. Faça isso quantas vezes for possível obter uma resposta lógica e utilizável. Geralmente você vai chegar à causa raiz na quinta porquê.
Funções de Gerenciamento de Problemas
Existem basicamente duas funções na indústria de TI para as pessoas que trabalham com gerenciamento de problemas. Um gerente problema é quem está no comando de todo o processo final de gerenciamento de problemas até o fim. Ele toma posse de todos os problemas que vêm em e é sua a responsabilidade de entregar RCAs no tempo. Um problema de relatórios coordenador de um gerente de problema. Um coordenador, basicamente, coordenadas entre as diferentes equipes técnicas para obter as informações necessárias para desenvolver a RCA e executa tarefas de controle de documentos, juntamente com rastreamento e monitoramento de problemas em aberto.
Na indústria de TI, cargo de gerente de problema é considerado um dos melhores papéis de contribuinte individual. Um especialista em ITIL, que conhece os processos muito profundamente quem está confiada esta tarefa. Eu trabalhei como coordenador problema inicialmente e depois como gerente de alguns anos atrás, ea experiência tem catapultou-me em uma posição mais elevada hoje. O trabalho era duro, e não para o trabalho que eu tinha que fazer, mas para as expectativas que eu precisava para gerir. No meu papel de presente, eu tenho quatro gerentes problema de comunicação dentro de mim, e eu olhar para eles para fornecer a perícia técnica é necessária para gerenciar a minha entrega. Digo isto para sublinhar a importância dos gestores problema em uma organização. Se seu gerente de problema é bom, sua empresa pode certamente dar um suspiro de alívio.
Conclusão
Tudo o que eu mencionei neste post é talvez uma pequena fração do problema da área de gestão do conhecimento. O campo é tão vasto, que nenhum livro que eu li até agora cobre completamente. É o mais definitivamente dar-lhe a satisfação de fazer algo completamente novo a cada dia, e mantém os seus sentidos à distância, observando por pistas que você desrosqueie os mistérios por trás da infraestrutura de TI.