<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>ITIL-es &#187; rca</title>
	<atom:link href="http://itil-es.es/tag/rca/feed/" rel="self" type="application/rss+xml" />
	<link>http://itil-es.es</link>
	<description>ITIL a la Española, tecnología, servicios IT, seguridad, y cualquier cosa que me llame la atención</description>
	<lastBuildDate>Wed, 28 Apr 2010 15:15:43 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Gestión de problemas: hila fino en los detonadores y descubre a tu mayor enemigo</title>
		<link>http://itil-es.es/2010/03/15/gestion-de-problemas-detonadores/</link>
		<comments>http://itil-es.es/2010/03/15/gestion-de-problemas-detonadores/#comments</comments>
		<pubDate>Mon, 15 Mar 2010 07:00:16 +0000</pubDate>
		<dc:creator>jbanez</dc:creator>
				<category><![CDATA[Sin categoría]]></category>
		<category><![CDATA[analisis de causa raiz]]></category>
		<category><![CDATA[detonadores]]></category>
		<category><![CDATA[gestion de problemas]]></category>
		<category><![CDATA[mejora continua]]></category>
		<category><![CDATA[rca]]></category>
		<category><![CDATA[root cause analysis]]></category>

		<guid isPermaLink="false">http://itil-es.es/?p=182</guid>
		<description><![CDATA[A la hora de establecer el proceso de Gestión de Problemas en una organización merece la pena dedicar cierto esfuerzo a definir los detonadores que se considerarán para la creación de registros de problemas.
El detonador es aquello que ha provocado que se desencadene el problema, lo que hace que aflore; tener una colección de detonadores [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://itil-es.es/wp-content/uploads/2010/03/usb-bomb.jpg"><img class="alignleft size-medium wp-image-191" title="usb-bomb" src="http://itil-es.es/wp-content/uploads/2010/03/usb-bomb-300x230.jpg" alt="" width="300" height="230" /></a>A la hora de establecer el proceso de Gestión de Problemas en una organización merece la pena dedicar cierto esfuerzo a definir los detonadores que se considerarán para la creación de registros de problemas.</p>
<p>El detonador es aquello que ha provocado que se desencadene el problema, lo que hace que aflore; tener una colección de detonadores bien tipificados y que elegir un detonador sea obligatorio en cada registro de problema gestionado, ayuda a:</p>
<ul>
<li>Identificar cuál es el factor que más frecuentemente desencadena problemas</li>
<li>Tener una visión numérica de los factores de riesgo que amenazan nuestros servicios</li>
<li>Detectar las malas prácticas que pueden ocasionar problemas</li>
<li>Y hacer algo útil con todo esa información después&#8230;</li>
</ul>
<p><span id="more-182"></span></p>
<p>&#8220;Detonador&#8221; no tiene nada que ver con causa raíz; el detonador va a hacer explotar un problema , va a hacer que se manifieste y que aflore; la causa raíz es el error o circunstancia que hace que, al darse ese detonador, el problema se dispare. Es decir, al final, la meta ha de ser erradicar la causa raíz: es lo que realmente evitará la recurrencia del problema; pero el control de los detonadores es importante y como parte del plan de acción que se diseña para solucionar un problema se deben incluir acciones encaminadas al control de los detonadores.</p>
<p>Ejemplos de detonadores que se me ocurren: uso válido. Es el más frecuente y, en realidad, el que más nos debe preocupar si aparece demasiado a menudo. Un ejemplo: que se te llene el disco de sistema porque una aplicación ha agotado el espacio disponible con los logs generados no es un fallo de aplicación, sino que es su comportamiento normal.</p>
<p>El problema que te ha generado es que se ha agotado el espacio en disco; posiblemente esa aplicación se ha detenido, y tambien es probable que todo el sistema que aloja dicha aplicación se detenga. Te has quedado sin servicio.</p>
<p>La causa raíz no es &#8220;los logs de la aplicación han agotado todo el espacio en disco&#8221;; la aplicación genera logs cuando funciona normalmente. Fue diseñada así. Es correcto. Y ese funcionamiento correcto según la norma ha sido el detonador. ¿Cuál sería la causa raíz? Que ese funcionamiento normal no se tuvo en cuenta en la fase de diseño; no se consideraron adecuadamente los requerimientos del servicio, en este caso de espacio en disco para logs, o no se aplicó una política de rotación de logs correcta o la que se aplicó se dimensionó incorrectamente. La raíz de causapodría caer en una categoría como  &#8221;Diseño / fallo de capacidad&#8221;, si el problema fue que el volumen de datos de registros fue inesperado, o en el caso de que la política de rotación de logs fuera inadecuada o no se aplicara, algo como &#8220;Política inadecuada&#8221;, en el sentido de que las políticas para la adopción de servicios quizás no estén correctamente definidas para entregar al negocio servicios resistentes a los detonadores (pero esto,  las clasificaciones de causa raíz, lo hablamos otro día).</p>
<p>Otros posibles detonadores que podrían incluirse:</p>
<ul>
<li>Fallo de un componente: fácil, el servidor se rompió, el switch se quedó lelo&#8230; un componente del servicio, simplemente, falló.</li>
<li>Fallo de infrastructura: como podrían ser problemas de alimentación eléctrica en el CPD (o que se te inunde, o que se incendie&#8230;)</li>
<li>Error humano: este es otro que aparece frecuentemente; un error de operación te la puede liar, y gorda.</li>
<li>Terceros (y aquí cabrían muchas subclasificaciones): bugs de software desarrollado por otros, fallos en comunicaciones, tu ISP&#8230;</li>
<li>Acto deliberado: que un <a href="http://www.youtube.com/watch?v=bSEc-HHTgJg">empleado cabreado te rompa algo</a> es algo que puede pasar&#8230; y un atentado terrorista tambien</li>
</ul>
<p><strong>Cuando ya los tengo clasificados&#8230; ¿qué hago?</strong></p>
<p>Cuando tras un periodo gestionando problemas tienes una muestra significativa de problemas analizados y resueltos, estudia la distribución porcentual de detonadores y elabora planes de acción para acotar su impacto actual y futuro; la gestión de problemas no sólo sirve para reducir el número de incidencias sino también el número de fallos de la plataforma tecnológica, y aquí incluyo todo lo que tenga que ver con el departamento TI: hardware, software y gente. A saber:</p>
<ul>
<li>Si tu detonador principal es &#8220;Uso válido&#8221;: revisa a fondo tus procesos de diseño y cambio, porque se están entregando al negocio servicios poco fiables, mal diseñados, mal dimensionados&#8230;</li>
<li>Si es fallo de componente: revisa la disponibilidad de tus servicios y la capacidad de tu plataforma;  si tus componentes críticos no están redundados, sientate con la dirección y analiza si el negocio lo necesita; puedes <a href="http://itil-es.es/2010/01/20/cfia-o-de-como-meter-el-pie-en-gestion-del-a-disponibilidad-y-la-continuidad-sin-despeinarse/">usar esto</a> para empezar el análisis</li>
<li>Si el error humano encabeza la lista: forma al personal, mejora tus procedimientos  e instrucciones de trabajo, introduce el uso de checklists para las tareas rutinarias, e idealmente, automatizalas.</li>
</ul>
<p>Y así con todos; y tambien sería importante delegar en los procesos de Mejora Contínua el perfilar esta lista de detonadores hasta ajustarla a las necesidades del servicio prestado. Cada organización va a necesitar considerar una colección de detonadores que represente de forma fidedigna qué hace estallar un problema en su negocio; por ejemplo, para un proveedor ISP móvil puede ser interesante incluir &#8220;Meteorología&#8221; como detonador mientras que a un proveedor web no le sirve de nada incluir tal categoría.</p>
<p>Pero así es todo; al fin y al cabo, ITIL no es un modelo pret-a-porter, sino una guía de estilo; no te vende el traje hecho, pero sí te deja bien claro que no combines nunca negro con azul.</p>
]]></content:encoded>
			<wfw:commentRss>http://itil-es.es/2010/03/15/gestion-de-problemas-detonadores/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Gestión de problemas: el terror del registro de problemas en blanco</title>
		<link>http://itil-es.es/2009/06/12/gestion-de-problemas-el-terror-del-registro-de-problemas-en-blanco/</link>
		<comments>http://itil-es.es/2009/06/12/gestion-de-problemas-el-terror-del-registro-de-problemas-en-blanco/#comments</comments>
		<pubDate>Fri, 12 Jun 2009 10:04:00 +0000</pubDate>
		<dc:creator>jbanez</dc:creator>
				<category><![CDATA[rca]]></category>
		<category><![CDATA[analisis de causa raiz]]></category>
		<category><![CDATA[gestion de problemas]]></category>

		<guid isPermaLink="false">http://metodico.wordpress.com/2009/06/12/gestion-de-problemas-el-terror-del-registro-de-problemas-en-blanco</guid>
		<description><![CDATA[El análisis de causa raíz (RCA) es una actividad intuitiva y nos sentimos naturalmente inclinados a hacerlo en nuestra vida cotidiana; disponemos de las técnicas y los métodos para realizar análisis profundos y precisos de nuestros eventos diarios, desde la enumeración de factores causales hasta la generación de recomendaciones y la implementación de cambios para [...]]]></description>
			<content:encoded><![CDATA[<p>El análisis de causa raíz (RCA) es una actividad intuitiva y nos sentimos naturalmente inclinados a hacerlo en nuestra vida cotidiana; disponemos de las técnicas y los métodos para realizar análisis profundos y precisos de nuestros eventos diarios, desde la enumeración de factores causales hasta la generación de recomendaciones y la implementación de cambios para eliminar la causa subyacente.</p>
<p>¿Por qué resulta entonces tan difícil trasladar esa habilidad al entorno laboral?</p>
<p>A nivel de gerencia <span class="misspell">IT</span>, existe una cierta conciencia sobre la necesidad de integrar la gestión de problemas dentro de los procesos de gestión <span class="misspell">IT</span>, pero con muchas reticencias a la hora de implementarla efectivamente, basándose en <a title="un puñado de motivos" href="http://metodistaesceptico.blogspot.com/2009/04/rca-incomprendida-mal-valorada-pero.html" id="db2v">un puñado de motivos</a> poco fundamentados. Es de esperar que si la dirección es resistente a la adopción de la gestión de problemas, más lo serán los técnicos implicados en ejecutarlo, por partida doble:</p>
<ul>
<li>El primer efecto percibido es un aumento en su carga de trabajo: cualquier organización mediana o pequeña evitará la dedicación exclusiva de ningún recurso al análisis de causa raíz porque es caro; de manera inmediata, sin entrar en cálculos de <span class="misspell">ROIs</span> o <span class="misspell">VOIs</span> y otros indicadores aún más etéreos, es cierto que supone un desembolso desde el inicio. Los técnicos han de compaginar en su jornada la prestación rutinaria del servicio y, además, investigar incidencias graves o recurrentes, y una vez hallada la causa raíz, proponer los cambios y mejoras necesarios para erradicarla.</li>
<li>El administrador de sistemas medio no sabe por dónde empezar&#8230; pero tampoco dónde acabar.</li>
</ul>
<p>Ese fue mi caso cuando me vi por primera vez en el brete de hacer un RCA y gestionar un problema: <span style="font-weight:bold;">&#8220;¿cómo hago un análisis de causa raíz?&#8221;</span><br /><span class="summarypost"><br /><a href="http://metodistaesceptico.blogspot.com/2009/06/gestion-de-problemas-el-terror-del.html">Después del salto, intento arrojar algo de luz sobre esto&#8230;</a><br /></span><span class="fullpost"></p>
<p><b>El terror del registro de problema en blanco</p>
<p></b>Imaginemos: el <span class="misspell">ServiceDesk</span> recibe un aluvión de llamadas de usuarios reportando que no les funciona el correo electrónico; se inicia el proceso de Incidente Grave, se desencadena el plan de acción, llega a Sistemas y un administrador lo resuelve; actualiza el registro de incidencia con la información de la resolución y se comunica a los usuarios el restablecimiento del servicio.</p>
<p>En una organización que haya iniciado la adopción de <span class="misspell">ITIL</span>, un incidente grave requiere la apertura de una investigación de problema; y ante la extensión inmaculada del registro de problema recién abierto se encuentra el administrador de sistemas encargado de completarlo. ¿Por dónde empezar?</p>
<p>Lo primero: identificar el servicio y sus componentes afectados por el incidente, algo que ya no es trivial en un departamento que no haya adoptado la Gestión de la Configuración y que tenga un catálogo de servicios incompleto, con poca sustancia, en resumen: más bien flojo. Tener que hacer el ejercicio de determinar los componentes de un servicio afectados por un incidente durante la investigación de problema tiene una ventaja: puede convertir esa información generada en <span class="misspell">input</span> para la Gestión del Catálogo de Servicios para enriquecerlo y así hacerlo más preciso y útil.</p>
<p>Lo siguiente es saber cómo documentar un registro de problema; requiere que contenga una descripción fiel y detallada del desarrollo de los acontecimientos desde la primera notificación del incidente hasta su resolución. La forma más clara: contarlo como si fuera una crónica periodística, en la que se establece primero el marco del suceso (fecha, hora y lugar) y después se detalla la secuencia cronológica de eventos. Una vez realizada esta crónica, comienza el análisis; para realizar esa parte, es conveniente disponer de un cuerpo de preguntas que:</p>
<ul>
<li>vertebre la investigación</li>
<li>prevenga el dejar cabos sueltos o áreas de responsabilidad vacías</li>
<li>nos ayude a identificar y formalizar las mejoras que conformarán la solución permanente al problema, y que es, en definitiva, el producto principal que debe extraerse de la gestión de problemas. </li>
</ul>
<p><b><br />Exponiendo los hechos: la verdad, toda la verdad y nada más que la verdad</p>
<p></b>Un registro típico de problema podría empezar con algo como:</p>
<p>&#8220;A las 10:15 <span class="misspell">am</span>, el usuario Joaquín Báñez contactó al <span class="misspell">Service</span> <span class="misspell">Desk</span> por teléfono y reportó que al abrir <span class="misspell">MS</span> <span class="misspell">Outlook</span> para acceder al correo se producía el siguiente mensaje de error&#8230;&#8221;</p>
<p>El primer paso en la investigación es, por tanto, recopilar todos los registros de incidencias relacionados con el problema que tratamos; el primero de ellos, se convertirá en el cabo del ovillo del que iremos tirando para responder a una colección de preguntas similar a:
<ul>
<li>cuándo fue detectado el incidente?</li>
<li>cómo se detectó?</li>
<li>¿qué se hizo para resolverlo?</li>
<li>¿qué impacto causó a los usuarios?</li>
<li>¿ha pasado antes? ¿es un problema recurrente?</li>
<li>¿se pudo de alguna manera detectar antes este problema?</li>
<li>¿se pudo de alguna manera resolver antes este problema?</li>
<li>¿existía documentación sobre esta incidencia en la base de datos de conocimiento? En tal caso, la instrucción de trabajo era adecuada para la resolución?</li>
<li>¿Debe algún otro equipo o proveedor estar involucrado en la investigación del problema?</li>
</ul>
<p><span style="font-size:85%;"><span style="font-family:Calibri;"><span style="font-family:georgia;font-size:100%;">En siguientes entradas, daré más detalles sobre cómo documentar, argumentar y contestar, de manera metódica y estructurada (y, sobretodo, documentada), todas estas preguntas.  </span></span></span></span></span></p>
]]></content:encoded>
			<wfw:commentRss>http://itil-es.es/2009/06/12/gestion-de-problemas-el-terror-del-registro-de-problemas-en-blanco/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>RCA: incomprendida, mal valorada, pero sobretodo desconocida.</title>
		<link>http://itil-es.es/2009/04/27/rca-incomprendida-mal-valorada-pero-sobretodo-desconocida/</link>
		<comments>http://itil-es.es/2009/04/27/rca-incomprendida-mal-valorada-pero-sobretodo-desconocida/#comments</comments>
		<pubDate>Mon, 27 Apr 2009 15:01:00 +0000</pubDate>
		<dc:creator>jbanez</dc:creator>
				<category><![CDATA[itil]]></category>
		<category><![CDATA[rca]]></category>
		<category><![CDATA[root cause analysis]]></category>
		<category><![CDATA[analisis de causa raiz]]></category>
		<category><![CDATA[deming]]></category>
		<category><![CDATA[gestion de problemas]]></category>
		<category><![CDATA[ingenieria]]></category>
		<category><![CDATA[metodologia]]></category>
		<category><![CDATA[six sigma]]></category>

		<guid isPermaLink="false">http://metodico.wordpress.com/2009/04/27/rca-incomprendida-mal-valorada-pero-sobretodo-desconocida</guid>
		<description><![CDATA[Llevo unos 8 años trabajando en el sector informático, siempre en equipos de soporte (menos una temporada en que el equipo de soporte era sólo yo). En los últimos 2 años, más allá de la explosión del hype de ITIL como receta dorada para convertir los departamentos de sistemas en máquinas perfectas (como si eso [...]]]></description>
			<content:encoded><![CDATA[<p>Llevo unos 8 años trabajando en el sector informático, siempre en equipos de soporte (menos una temporada en que <a href="http://es.wikipedia.org/wiki/Averno_astral">el equipo de soporte era sólo yo</a>). En los últimos 2 años, más allá de la explosión del hype de ITIL como receta dorada para convertir los departamentos de sistemas en máquinas perfectas (como si eso bastara), una de las expresiones más utilizadas para vender y comprar servicios de soporte IT es “mejora contínua”.<br /><span class="summarypost"><br /><a href="http://metodistaesceptico.blogspot.com/2009/04/rca-incomprendida-mal-valorada-pero.html">Seguir leyendo&#8230; </a></p>
<p></span><span class="fullpost">En enero de 2008 me incorporé en un equipo de soporte IT formado por 5 personas, donde desempeñé el rol de administrador de sistemas; el cliente era un grupo empresarial privado al que mi empresa vendió un servicio de soporte gestionado y la implantación de algunos procesos ITIL: gestión de incidentes, gestión de problemas y gestión de cambios.<br />Yo nunca conocí nada parecido, en el mundo de la administración de sistemas, a la gestión de problemas, cuya misión es encontrar la causa raíz que subyace bajo los incidentes graves o recurrentes, y una vez encontrada, proponer un cambio (en la infrastructura, en los procedimientos de operación, en la documentación o donde haga falta) para erradicar esa causa y, por tanto, erradicar la recurrencia de esos incidentes.<br />Estos procesos son comunes en cadenas de producción industrial, descritos desde hace años en estándares como <a href="http://es.wikipedia.org/wiki/Seis_Sigma">Six Sigma</a> y otras tambien basadas en <a href="http://en.wikipedia.org/wiki/PDCA">el ciclo de Deming</a>, pero descubrí que en el entorno IT resulta muy complejo implantarlos con éxito; pensé que sería debido a la idiosincrasia particular de la empresa en la que intentábamos implantarla, pero tras varias charlas con colegas y algunas búsquedas en Google descubrí que el mayor obstáculo es que clientes, proveedores y técnicos no comprenden adecuadamente el análisis de causa raíz (RCA en adelante, siglas en inglés de la expresión Root Cause Análisis).<br />Entienden, en la mayoría de casos, la importancia que puede tener para la mejora de la infrastructura, del servicio ofrecido por el departamento IT, incluso alguno es capaz de medir esa importancia con conceptos avanzados como TCO y ROI (y la ventaja que el uso de esos datos frente a la Dirección aporta), pero en pocos casos se entrevé un conocimiento profundo del RCA, de la visión necesaria para afrontarla, de qué información relevante debe desprenderse de un RCA, qué output esperar y cómo usar esa información.<br />Esto provoca que una implantación de ITIL en una organización sea incapaz de completar los 4 pasos del ciclo de Deming, convirtiendo el ciclo “Plan, Do, Check, Act” en “Plan, Do, Stop”.<br />Algunos de los obstáculos principales que se pueden encontrar en una organización (y más que obstáculos, frecuentemente, es resistencia del propio departamento IT), incluyen excusas como:</p>
<ul>
<li>No hay tiempo: los técnicos no disponen de tiempo para efectuar RCA, porque casi todo su tiempo lo invierten en apagar fuegos; no implementar la gestión de problemas o cualquier otro método de RCA, y obviamente ejecutar los cambios que se extraigan como solución para extirpar la causa raíz de dichos incidentes, alimenta esos fuegos y las tareas de extinción consumen cada vez más tiempo, más recursos… y consumen tambien la imagen de profesionalidad que pueda quedarle al equipo IT en la organización.</li>
</ul>
<p>
<ul>
<li>No hay dinero: un cambio, casi siempre, requiere una inversión; si de un RCA se espera como salida una propuesta de cambio, se debe contar con la necesidad de realizar un gasto (gasto, por otro lado, justificable simplemente con el contenido del RCA, si es correcto, profundo y bien documentado). La realidad es: pueden los jefes de unidades IT conseguir ese dinero? Están dispuestos a partidas ya asignadas, por ejemplo, a la renovación de la electrónica de red, solicitada, sin embargo, con muchos menos argumentos que la petición de cambio extraída de un RCA? Tienen estos responsables una visión clara y realista del coste que tienen, para su departamento y para toda la organización, los incidentes IT (el descenso en la productividad de los usuarios afectados o las horas invertidas por el personal IT en solventar esos incidentes?)</li>
</ul>
<p>
<ul>
<li>No se sabe a ciencia cierta de qué incidentes se trata: los técnicos de un Service Desk están más preocupados por resolver las incidencias que reciben que por recoger todo tipo de detalles relativos a las circunstancias en que se ha producido el incidente; asimismo, suele ser frecuente el desinterés a la hora de relatar las acciones seguidas para solventarlo, si resuelven el incidente. Por último, los service desks suelen contar con un sistema manual de clasificación y calificación de incidentes; esto hace que la relación de incidentes atribuibles a una causa raíz común sea generalmente incompleta, parcial y pobre, y dificulta cuantizar tanto el impacto que tendría sobre la organización no erradicar el problema que se está analizando como el beneficio de implementar el cambio propuesto para erradicarlo. </li>
</ul>
<p>Todo lo anteriormente expuesto, cristaliza, en el mundo real, en una pregunta que directivos, responsables IT y técnicos lanzan al que defiende la imperiosa necesidad de implantar la gestión de problemas y los RCA: “<span style="font-weight:bold;">¿para qué?</span>”.</p>
<p>Y eso demuestra que no sólo no comprenden la importancia de conocer la causa raíz que detona los incidentes graves en su organización, sino que tampoco tienen una visión clara del impacto que incidentes graves o menos graves tienen sobre la productividad de su organización y, aún peor: de su departamento.</p>
<p>Sobre esto último tengo que hablar largo y tendido, porque otra de las actitudes que más detesto en el mundo de la informática es la incentivar el comportamiento de bombero entre los técnicos, el considerar héroes a los resolutores veloces de incidencias graves y fomentar la actitud cowboy de cabalgar a lo loco sobre la administración de sistemas. Este es el rollo en el equipo donde trabajo ahora, y la verdad es que se tiene que acabar, es demasiado 90&#8217;s&#8230;</span><br /></span></p>
]]></content:encoded>
			<wfw:commentRss>http://itil-es.es/2009/04/27/rca-incomprendida-mal-valorada-pero-sobretodo-desconocida/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>
