Gestión de incidentes, ¿Qué es? (Primera parte)

La gestión de incidentes es uno de los procesos más importante en ITIL®, ya que las organizaciones invierten tiempo y esfuerzo en desarrollar una estrategia de servicio, diseñar servicios que aumenten las necesidades comerciales de la organización y luego convertir esos diseños en servicios reales que los usuarios pueden operar y mantener esos servicios para los usuarios que se comprometan con ellos cada día.

Los procesos de Gestión de Incidentes de ITIL ayudan a las organizaciones a obtener el mejor retorno posible de esos esfuerzos trabajando para resolver los problemas que afectan la disponibilidad de los servicios. Por tal motivo, la gestión de incidentes es uno de los primeros procesos que suelen adoptar las organizaciones.

En esta serie de entradas al blog, plantearemos a detalle el sistema de Gestión de Incidentes de ITIL. Comenzando con una definición y una declaración de objetivos para el proceso, veremos cómo ITIL define el flujo del proceso, entenderemos cómo el equipo de soporte trabaja en conjunto para resolver incidentes de TI y aprenderemos cómo puede medirse el éxito del proceso dentro de una empresa usando los Indicadores clave de rendimiento (KPIs). En el siguiente post examinaremos cómo el nuevo software integrado de gestión de servicios facilita la automatización y ayuda a las organizaciones a establecer una mesa de servicio consolidada y resolver incidentes de manera más eficiente.

¿Qué es la gestión de incidentes en ITIL?

En ITIL, el término "incidente" se usa para describir una interrupción o reducción no planificada de la calidad de un servicio de TI, lo que puede ser tremendamente costoso para las grandes organizaciones.

El objetivo principal del proceso de gestión de incidentes es devolver el servicio a los usuarios lo más rápido posible cuando se producen interrupciones.

Junto con el cumplimiento de solicitudes básicas, la Gestión de incidentes es uno de los procesos más importantes que las organizaciones de TI administran cada día. Si bien el proceso de cumplimiento de la solicitud se utiliza para abordar las solicitudes estándar de los usuarios, como cambiar una contraseña, Incident Management resuelve las interrupciones genuinas del servicio con el objetivo de resolver la interrupción y devolver el servicio a los usuarios lo más rápido posible.

En el modelo de ciclo de vida del servicio de cinco etapas utilizado en ITIL, la Gestión de incidentes se incluye en "Operación del servicio". Esta es la cuarta etapa del ciclo de vida del servicio y en la que la organización ya está operando un servicio. El proceso ayuda a garantizar que una organización pueda extraer el máximo valor de los servicios y aplicaciones que admite al trabajar para garantizar el rendimiento, la disponibilidad y el acceso del usuario al servicio.

Playbook - 5 Formas de acelerar la Gestión de Servicios de TI

¿Cuáles son los procesos de gestión de incidentes y flujos de trabajo?

La gestión de incidentes es el proceso que siguen las organizaciones de TI para gestionar el ciclo de vida de los incidentes que se informan. Ese proceso consta de varios pasos, a menudo conocidos como subprocesos, que deben llevarse a cabo para garantizar que los incidentes se resuelvan y documenten adecuadamente. A continuación, describimos cada uno de los subprocesos y lo que logran para la organización.

Soporte de gestión de incidentes

El objetivo del soporte de gestión de incidentes es proporcionar y mantener las herramientas, procesos, habilidades y reglas necesarias para el manejo eficaz y eficiente de los incidentes. Este proceso ayuda a garantizar que los agentes o técnicos de la mesa de servicio tengan una educación y capacitación adecuadas para responder y resolver incidentes que ocurren dentro de la organización de TI. Este proceso también mantiene las reglas y los flujos de trabajo para procesar y resolver incidentes, asegurando que los técnicos siempre sepan cuál es el siguiente paso para garantizar que se resuelva un incidente.

Registro y categorización de incidentes

El objetivo de este subproceso es registrar y priorizar los informes de incidentes con la diligencia adecuada para facilitar una resolución rápida y efectiva. Las organizaciones a menudo tienen recursos limitados para resolver incidentes y otros problemas de TI, y la priorización efectiva de los informes de incidentes entrantes es un paso crucial para garantizar que la mano de obra se asigne de manera adecuada a los incidentes de mayor prioridad. Las organizaciones de TI deben ser competentes para determinar el alcance y la gravedad de un incidente reportado y priorizarlo en consecuencia.

El registro de incidentes y las categorizaciones a menudo se automatizan, por ejemplo, cuando una solución de monitoreo de operaciones de TI crea un incidente debido a un evento de rendimiento o disponibilidad.

Resolución inmediata de incidentes por el soporte de primer nivel

Cuando un usuario informa un incidente a la mesa de servicio por primera vez, generalmente informará el problema a un técnico de servicio de primer nivel. El resultado ideal es que el técnico de primer nivel puede abordar el incidente y restaurar el servicio de TI en la primera llamada y dentro del tiempo de resolución objetivo establecido por la organización de TI. Cuando un incidente no se puede resolver dentro del tiempo previsto, o si se requiere un mayor grado de conocimiento técnico especializado para resolver el incidente, se produce una escalada y un técnico de soporte de segundo nivel puede hacerse cargo del incidente.

Resolución de Incidencias por segundo nivel de apoyo

Una vez que un incidente se ha escalado más allá de una resolución en la primera llamada por el apoyo de nivel 1, un técnico de soporte de segundo nivel puede hacerse cargo del incidente y comenzar a buscar una solución para restablecer el servicio lo más rápidamente posible. En este nivel, el técnico tiene la flexibilidad de involucrar a grupos de apoyo o proveedores terceros en la resolución del incidente.

Si el incidente se debe a una aplicación defectuosa, por ejemplo, el técnico de segundo nivel puede comunicarse con la compañía que desarrolló la aplicación para obtener orientación adicional para resolver el incidente. Si no hay manera de abordar la causa raíz del incidente, el técnico de soporte de segundo nivel puede crear un registro de problemas y transferir el incidente al proceso / equipo de administración de problemas.

Manejo de incidentes mayores

Anteriormente, mencionamos la importancia de priorizar los incidentes de acuerdo con su urgencia para que los recursos se puedan implementar de la manera más eficiente. Los incidentes importantes son los incidentes de TI de mayor prioridad que una organización puede reconocer: constituyen interrupciones o amenazas graves para las actividades comerciales y deben resolverse con la mayor urgencia para evitar pérdidas financieras u otras consecuencias críticas. Los incidentes mayores se escalan rápidamente a través del personal de soporte de 1 ° y 2 ° nivel y pueden involucrar a proveedores externos si el incidente no se resuelve rápidamente. Nuevamente, si una corrección de la causa raíz es imposible, el incidente se transfiere a la Gestión de problemas.

Supervisión y escalamiento de incidentes

Las organizaciones de TI que siguen las mejores prácticas de ITIL establecerán y mantendrán un sistema para monitorear el estado y las escaladas de cada incidente de TI que se informa. Los administradores de TI que se ocupan de la Gestión de incidentes deben poder realizar un seguimiento de la cantidad de incidentes notificados actualmente y ver su estado en el proceso de Gestión de incidentes. Los acuerdos de nivel de servicio se incumplen cuando el equipo de gestión de incidentes tarda demasiado en responder a los incidentes y las interrupciones del servicio provocan interrupciones en el negocio. El monitoreo de incidentes se utiliza para garantizar que los tickets de Gestión de incidentes se resuelvan y se muevan a través del proceso de manera oportuna, de manera que los niveles de servicio se mantengan para la organización.

Cierre y evaluación del incidente

Una vez que el incidente se ha resuelto de manera efectiva, el registro del incidente se envía a un paso final de control de calidad. Este subproceso confirma que el incidente se ha resuelto y que el ciclo de vida del incidente se ha documentado con suficiente detalle. La organización puede utilizar los hallazgos del informe de incidentes en el futuro, incluso como una entrada para el proceso de Gestión del Conocimiento. El cierre y evaluación de incidentes ayuda a garantizar que la organización rastree toda la información importante sobre un incidente y que pueda aprender algo sobre el incidente al resolverlo.

Información proactiva del usuario

Los informes de gestión de incidentes generalmente se envían a través del servicio de atención al cliente de la organización, que actúa como un único punto de contacto para los recursos de TI dentro de la organización. El equipo de la mesa de servicio también puede usar este portal de comunicación para informar proactivamente a los usuarios sobre problemas conocidos y cortes de servicio dentro de la organización. Este subproceso ayuda a distribuir información en toda la organización y reduce el número de solicitudes y consultas en la mesa de servicio al proporcionar información actualizada sobre las interrupciones del servicio dentro de la organización.

Informes de gestión de incidentes

Este subproceso trabaja para capturar información del proceso de gestión de incidentes y suministrarla a los otros procesos de gestión de servicios, asegurando que la organización tenga la oportunidad de mejorar su rendimiento basándose en datos de incidentes pasados.

Tal vez te interese: 5 Do’s y Don’ts de la Gestión de Incidentes

En el siguiente post hablaremos sobre cómo miden las organizaciones el éxito en la gestión de incidentes para la mejora continua del servicio.

Solicita una demostración de Cherwell Software