Re: [itsm_br] Re: Ainda incidente?

Gisely Wed, 17 Jun 2009 08:05:41 -0700

"Até que ponto é correto assumir um risco para atender um acordo de nível de
serviço?"


Entendo que um risco pode ser assumido se as consequências estiverem claras
para todos os envolvidos e se o resultado final, compensar os riscos. Aquela
velha história de "risco calculado". Neste seu exemplo, entendo que este não
é um risco que TI tem que assumir para atender um acordo de nivel de
serviço. É um risco que o board gerencial tem que assumir para o bem do
negócio. TI apenas apenas executará.
Portanto, neste caso eu não consideraria o acordo de nível de serviço, tendo
em vista que é uma situação excepcional.

Abraço,
Gisely Ferraz - ITQM



2009/6/17 Luciano Silveira <[email protected]>

>
>
> E aí Felipe, quando trabalhava ao seu lado sempre gostei deste seu perfil
> de grande questionador.
> Têm horas que trabalhamos no automático e acabamos esquecendo de
> pensar/perguntar se aquela forma de fazer é a melhor ou mais correta.
>
> Acredito que as respostas dadas até o momento já ajudam na reflexão da
> questão, então gostaria de aproveitar para colocar um outro caso que
> ocorreu:
>
> Certo dia durante o expediente o no-break "caiu" e com ele vários
> servidores ficaram inoperantes, causando parada de diversos serviços
> (incidentes).
> O Diretor, também grande conhecedor de ITIL, questionando a equipe de
> suporte sobre o que havia ocorrido recebeu a informação que houve queima do
> fusível, como não havia outro de reserva no local (grande falha por sinal)
> já estavam providenciando aquisição de outro no comércio para restabelecerem
> os serviços. Porém o Diretor disse para colocar o no-break em by-pass para
> que os serviços voltassem em operação o quanto antes (haviam muitos
> empregados parados) e posteriormente na janela de manutenção realizarem a
> troca (além de registrar o problema para investigação da capacidade do
> sistema eletrico).
> No final acabou-se trocando o fusível bem naquele instante(acho que
> conseguiram utilizar o de outro equipamento que estava danificado).
>
> A princípio discordei do Diretor, já que utilizando o by-pass estaríamos
> colocando em risco a proteção elétrica dos servidores e com esta solução
> poderíamos causar um incidente ainda mais grave.
> Os argumentos dele eram que o incidente teria que ser solucionado na menor
> janela de tempo possível.
>
> Até que ponto é correto assumir um risco para atender um acordo de nível de
> serviço?
>
> Luciano Silveira
> [email protected] <lucianojs%40gmail.com>
> MSP - Microsoft Student Partner
> MCSA, MCTS, MCP
> Google profile: http://www.google.com/profiles/lucianojs
>
> 48 3365-0930 (NET) | 48 8465-0930 (OI) | 34 3221-8550 (Fixo Voip - Atendo
> em Floripa)
> Florianópolis - SC
>
>
> --- In [email protected] <itsm_br%40yahoogroups.com>, "Sergio
> Rubinato Filho" <rubin...@...> wrote:
> >
> > Caro Felipe Rezende,
> >
> >
> >
> > Depois de vários comentário "interessantes" derivados de sua pergunta e
> > refletindo sobre o seu caso, minha recomendação inicial é:
> >
> >
> >
> > O "X" da questão está na satisfação e comprometimento do usuário em
> função
> > ao do serviço prestado – e conseqüentemente a forma com que a TI prove
> > suporte aos serviços que oferece.
> >
> >
> >
> > Permita transmitir o meu entendimento e idéias entorno do assunto de
> forma
> > prática: o usuário, sentindo alguma degradação no serviço (sempre em
> função
> > do que fora combinado – ANS), está no direito de pedir auxilio e negociar
> o
> > momento mais conveniente para que uma solução (de contorno ou definitiva)
> > seja aplicada. Daí temos a questão da gestão do serviço que TI presta
> neste
> > momento, que na minha opinião está buscando sair da sua condição de
> > subdesenvolvimento – no que toca os métodos de gestão – por meio de
> aplicar
> > as práticas correntes e supostamente mais modernas. Mais isso é um outro
> > assunto, que alias dá pano pra manga.
> >
> >
> >
> > Voltando a vaca fria: como proceder com o gerenciamento deste registro de
> > incidentes? (ocorrência, trouble ticket, TT, ticket, chame-se como quiser
> > desde que esteja claro o que se pretende com o registro desta
> informação).
> >
> >
> >
> > Em qualquer relação (sobre tudo numa prestação de serviços) todos os
> > elementos do sistema tem um papel a ser desempenhado que deve ser medido,
> > possibilitando a entrega do serviço da forma mais eficiente, controlada
> > (tirando a máxima utilidade do sistema como um todo). Com isso assumimos
> que
> > o usuário também deve ser medido quando da interação com o processo,
> sempre
> > na forma de esforço e disponibilidade da parte dele (o que por princípio
> não
> > é linear e sim transacional). Do lado da TI a forma com que medimos a
> > produtividade e efetividade do suporte aos serviços de TI por convenção
> > assume períodos lineares, que na minha avaliação é uma das causas raiz do
> > problema. Explico: não podemos responsabilizar a TI por algo que está
> fora
> > do seu controle (reforço o exemplo da medicina: se um médico pede um
> exame
> > ou prescreve um medicamento no sentido de tratar a condição é
> > responsabilidade do paciente seguir as recomendações dentro dos prazos
> > convenientes e que não ofereçam risco a sua saúde). Por isso sustento a
> > prática de medição da nossa proficiência TÉCNICA por esforço (horas de
> fato
> > trabalhadas) que alocamos para restabelecer o serviço e, separadamente
> mas
> > no contexto de prestação de serviços, nossa proficiência de GERENCIAMENTO
> > (tempo total linear que lançamos não das nossas habilidades
> interpessoais,
> > confiabilidade, integridade, etc para auxiliar o nosso usuário). Quais as
> > vantagens aqui são: 1) atribuir claramente qual recurso lançaremos não em
> > cada etapa da prestação do serviço, 2) clareza e transparência
> facilitando a
> > contabilização dos recursos utilizados pelo sistema, 3) assertividade na
> > alocação de recursos, 4) melhor qualidade percebida na prestação do
> serviço,
> > 5) facilidade de se apresentar o resultado do trabalho, 6) clareza na
> > prestação de contas e recebimentos por conta dos serviços prestados.
> >
> >
> >
> > Além de muita comunicação e entendimento mutuo (inerente de qualquer
> > prestação de serviço de qualidade), umas das ferramentas que você pode
> > lançar mão é e justamente o ITIL no que diz respeito ao Gerenciamento de
> > Incidentes. Você pode usar os STATUS do registro (aberto, em andamento,
> > diagnosticado, solucionado, corrigido, restabelecido, encerrado, etc –
> > atenção para não se pegar na semântica) como forma de registrar a
> cadência
> > linear do registro e as interações com o usuário (como se fosse o
> prontuário
> > do atendimento) e SUB-RESGISTROS de Incidentes (também conhecidos como
> > pai-filho, incidentes hierárquicos, incidentes relacionados, etc) para
> > registras o esforço necessário para resolvermos a situação (comparando
> com
> > pedidos de exames, receituários, etc). Com isso o seu registro principal
> de
> > incidentes segue com o uso linear dos status, apresentando ao usuário e
> > buscando registrar o entendimento e comprometimento dele por meio de:
> > detalhar o que está acontecendo, apresentar solução recomendada (e os
> > porquês), condições e prazos para evoluirmos para a próxima etapa do
> suporte
> > e os acordos relativos em função do acordo de nível de serviço ao qual
> > estamos seguindo (revisite na medicina o processo de diagnostico e
> > tratamento de doenças que você achará muitas respostas).
> >
> >
> >
> > Posto isso, creio que atacamos o cerne da questão: organização do
> trabalho
> > passando principalmente pela definição clara de papeis,
> responsabilidades,
> > expectativas, forma de acompanhamento, parâmetros de medição de qualidade
> e
> > método de apresentação dos resultados.
> >
> >
> >
> > Espero que com esta pequena mensagem tenha conseguido transmitir que para
> a
> > correção e restabelecimento do serviço como combinado não depende somente
> da
> > TI, portanto não podemos somente medir o desempenho de um todos
> componentes
> > do sistema e esperar que tenhamos uma visão clara da qualidade do serviço
> > como um tudo – o que é geralmente a regra em TI).
> >
> >
> >
> > Desejo muita sorte e paciência para que você consigo desatar este nó.
> >
> >
> >
> > Cordiais,
> >
> >
> >
> > Sergio Rubinato Filho
> >
> >
> >
> > From: [email protected] <itsm_br%40yahoogroups.com> [mailto:
> [email protected] <itsm_br%40yahoogroups.com>] On Behalf Of
> > Pablo Emanuel
> > Sent: Monday, June 08, 2009 8:30 AM
> > To: [email protected] <itsm_br%40yahoogroups.com>
> > Subject: Re: [itsm_br] Ainda incidente?
> >
> >
> >
> >
> >
> >
> >
> >
> > Carlos,
> >
> >
> >
> > pelas definições do ITIL, um incidente nunca é "promovido" para problema
> ou
> > mudança. Um incidente pode estar associado a um problema (ou até mesmo a
> > mais de um) e, se não tivermos nenhuma solução de contorno, a solução do
> > incidente pode até estar vinculada à resolução do problema (que, muito
> > provavelmente, será uma mudança), mas nunca um vira o outro. A pergunta
> > original pode ser generalizada para "o que fazer quando não existe
> > workaround e a solução de um incidente depende de uma mudança?"
> >
> >
> >
> > Não me atrevo a dizer que eu tenha a solução definitiva para esta
> questão,
> > mas o procedimento que eu tenho seguido nestes casos é negociar com a(s)
> > área(s) afetada(s) - envolvendo o ponto focal da área no processo de
> change
> > management (normalmente o gerente da área) - o prazo necessário para a
> > execução da mudança (de acordo com os procedimentos de change
> management), e
> > alterar o status do incidente para um status especificamente criado para
> > este fim até a execução da mudança. Desta forma, podemos identificar este
> > cenário nos relatórios. Se simplesmente deixássemos o íncidente como
> > "Aberto", ele se misturaria com os incidentes em que não houve acordo com
> as
> > áreas; se simplesmente encerrássemos o incidente, ele se misturaria com
> os
> > casos em que a solução de contorno foi efetiva.
> >
> >
> >
> > Abraço,
> >
> >
> >
> > Pablo Emanuel
> >
> > 2009/6/7 Carlos Roberto Santos Almeida <carlos.alme...@...>
>
> >
> >
> >
> > Boa noite.
> >
> >
> >
> > Felipe,
> >
> >
> >
> >
> >
> > Ao me deparar com esse tipo de situação, tento sempre ponderar o
> seguinte:
> >
> >
> >
> > O objetivo do processo de Incident Management, segundo o book, é devolver
> o
> > serviço normal no menor espaço de tempo possível. Sendo assim, Tickets
> cujo
> > o atendimento pode ser "postergado" descaracteriza essa máxima,
> > descaracterizando assim o ticket que poderá ser "promovido" de incident
> para
> > problem (caso a causa raiz ainda não seja conhecida/documentada) ou ainda
> > change (sendo agregado à janela padrão de mundaças).
> >
> >
> >
> > O book prevê que o incident pode ser reconhecido como algo que afeta
> > parcialmente um determinado serviço. Pórem, se o impacto é tão parcial
> que a
> > resolução possa esperar a próxima janela de mudanças, este ticket
> original
> > deve ser fechado com as informações das tratativas executadas e com a
> > solicitação do usuário de aguardar a próxima janela de mudança.
> >
> >
> >
> > Outro ponto de análise para se tirar da situação proposta é que, hoje em
> dia
> > com a infra atual, os serviços estão todos agregados em servidores. Sendo
> > assim, a solução para incidents que afetam (totalmente ou parcialmente)
> um
> > determinado serviço, dificilmente estarão nos clients e possivelmente
> > estarão afetando mais que um usuário no ambiente. Dessa forma, mais uma
> vez
> > migraremos o ticket para a disciplina de problem e em seguida change.
> >
> >
> >
> > Lógico que toda essa colocação é do ambito teórico e que, no âmbito
> prático,
> > o que vale é o acordo prévio com o cliente sobre a tratativa que será
> dada
> > para esta situações.
> >
> >
> >
> >
> >
> > Espero ter contribuido para a discussão.
> >
> >
> >
> > --
> > Att.:
> >
> >
> >
> > Carlos Roberto Santos Almeida
> > Mobile +55 11-8279-7704
> > carlos.alme...@...
> > "http://www.linkedin.com/in/carlosroberto";
> >
> > 2009/6/3 Felipe Rezende Sales Barbosa <felipe...@...>
> >
> >
> >
> > Caros,
> >
> >
> >
> > Gostaria de uma ajuda de vocês.
> >
> > Sabendo que um incidente é uma interrupção total ou parcial ou ainda uma
> > queda de qualidade de um determinado serviço de TI, tenho a seguinte
> dúvida:
> >
> >
> >
> > Considere o cenário em que ocorreu um incidente do tipo queda de
> qualidade
> > em um determinado serviço de TI e a solução para o mesmo exige uma parada
> > momentânea do serviço. Porém, o usuário que abriu o incidente não aceita
> > essa parada e prefere ficar com o serviço com baixa qualidade, tendo
> > portanto que esperar pela próxima janela de manutenção do serviço para
> > resolver a questão.
> >
> > A dúvida é a seguinte: Até a próxima janela de manutenção esse incidente
> > fica aberto? Sendo sim a resposta, essa ação impacta no indicador de
> tempo
> > de resolução de incidentes.
> >
> >
> >
> > Aguardo a participação de todos.
> >
> >
> >
> > Atenciosamente,
> >
> >
> > --
> > Felipe Rezende Sales Barbosa
> >
> > Consultor
> >
> > Invit Information Services - Uberlândia
> > (34)9929-1109
> >
>
>  
>

Re: [itsm_br] Re: Ainda incidente?

Responder a