Etiqueta: continuidad de negocios

  • Enseñanzas que deja el incendio del DataCenter de IBM Venezuela

    Enseñanzas que deja el incendio del DataCenter de IBM Venezuela

    Hace poco más de un año ocurrió un incendio en las instalaciones de IBM en Venezuela que afectaron el Data Center de la empresa. Esta semana conversamos con el presidente de la empresa para comprender y aprender sobre el hecho

    incendio Torre IBM
    El incendio en la Torre IBM afectó su DataCenter y a los clientes sin planes de Disaster Recovery
    Juan José Denis –más conocido como JJ– es el presidente actual de IBM Venezuela, y también lo era durante el incendio ocurrido el 22 de Noviembre de 2013. La causa del siniestro fue un corto circuito en una lámpara en el Lobby, que generó un incendio que no pudo ser sofocado de manera inmediata, por su gran altura. Además el edificio se encontraba en reparaciones –incluyendo reforzamiento anti-sísmico—y eso complicó más el incidente. Finalmente los cables que llevan los datos hicieron ignición y el humo producido, junto a los esfuerzos por controlar el fuego, terminaron impactando el corazón del centro de datos.

    El resultado fue que muchos clientes de IBM , y la infraestructura interna de la empresa, se vieron afectados, incluyendo a una de las principales redes de cajeros automáticos del país, conocida como Suiche 7B, que tomó seis días para volver a estar operativa.

    Pero no es de las consecuencias inmediatas de lo que hablaremos en este post, sino de las consecuencias a largo plazo sobre los clientes y sobre la forma de actuar de la misma IBM, tanto en Venezuela, como en el resto de la región.

    Por mucho tiempo el accidente fue tema de conversación con colegas, que me preguntaban sobre la tardanza en la restitución de algunos servicios, las consecuencias sobre la operación de las empresas afectadas y especialmente preguntaban por qué estas empresas guardaban silencio en su gran mayoría y no culpaban públicamente a IBM por los inconvenientes. Mi respuesta siempre era la misma “sin conocer el contrato de cada empresa, me atrevo a aventurar que muchas de ellas no contrataron servicios extra de respaldo de datos, de operación en casos contingencia, lo que normalmente se conoce como Disaster Recovery”. La respuesta de Denis a esta pregunta confirmó mi sospecha. Según afirma “sólo un 20% tenía contratado este tipo de servicios” y habían firmado cartas de descarga de responsabilidad para IBM. Sin embargo la empresa no escatimó en gastos, a decir del ejecutivo, para ayudar a los clientes para recuperar su información, y el 100% de los clientes que estaban con ellos antes del incidente, siguen contratando los servicios de IBM Venezuela, e incluso casi el 85% están funcionando desde el Centro de Datos recuperado, y el 15% restante funciona desde sus propios centros de Datos o desde algunos de terceros, y varios están planeando regresar al Centro de Datos de IBM en los próximos meses.

    Lo más resaltante aquí es la actuación de IBM una vez ocurrido el siniestro, tomando responsabilidades que fueron más allá de lo estipulado en el contrato. Denis afirma que el comportamiento del personal, comprometido con el cliente, fue una de las bases de esta actitud.

    Actualmente el 100% de los clientes tiene contemplado, además del servicio de Centro de Datos, un servicio de respaldo y funcionamiento alterno, para lo que IBM de Venezuela ha realizado alianzas con otros Centros de Datos en Venezuela, para remediar problemas de ancho de banda, conexión y acceso a divisas, así como para cumplir con regulaciones locales de empresas como bancos.

    Normalmente las empresas suelen rechazar planes de “Disaster Recovery” por considerarlos altos, pero después de este incidente, muchas empresas venezolanas comenzaron a reconsiderar esta idea. Dependiendo de la empresa, su nivel de negocios y su responsabilidad con sus clientes, las empresas pueden considerar planes más sencillos o complicados. Preguntas cómo ¿cuanto tiempo puede estar mi empresa fuera del aire? ¿cuanto cuesta el día/hora de estar sin sistemas? ¿puede haber pérdidas humanas o consecuencias sobre personas por estar fuera de línea? son las que debe plantearse cada directorio ejecutivo antes de considerar “costoso” un plan de “Disaster Recovery”. Por su parte IBM aprendió a insistir aún más en que los clientes cuenten con estos servicios, explicando de manera muy detallada, y usando el ejemplo ocurrido en Venezuela, las consecuencias de no contar con estos planes de contingencias.

    Así quizás el día de mañana amigo empresario, evites que esté hablandodeti y de como tu empresa quedó sin funcionar por culpa de no contar con un plan adecuado para contingencias.

  • Lecciones TI desde la tierra del sol naciente

    Lecciones TI desde la tierra del sol naciente

    La gran tragedia experimentada por el pueblo japonés con el brutal terremoto y el devastador tsunami posterior, ha puesto a prueba decenas de teorías en la mente de los grandes planificadores en TI.

    Más allá del colapso sufrido por los servicios de voz en las redes celulares –que no fue tan grave en los servicios inalámbricos de datos—y del colapso lógico del transporte. La infraestructura parece no haber sido dañada de manera importante en las zonas lejos del epicentro y que no fueron afectadas por el tsunami. Por supuesto que la historia es otra en las zonas afectadas por el maremoto, donde ocurren hasta problemas en los reactores nucleares.

    Por supuesto que la producción de insumo para TI se verá afectada, así como en dispositivos electrónicos, al pararse la fabricación de chips y aparatos electrónicos, de los que Japón es responsable por al menos un 14% de las ventas. Se espera que la mayoría de las fabricas –y por ende su producción—esté interrumpida por al menos dos semanas, según datos de la consultor iSupply. Pero las lecciones a las que quiero hacer referencia escapan de esta consideraciones de mercado.

    Más bien se trata de las lecciones que las empresas han aprendido del desastre. En Computerworld EUA (http://bit.ly/giAtFP) hay un artículo muy interesante de una empresa con Centros de datos en ambas costas de EUA, que debió tomar precauciones ante la amenaza de Tsunami en la costa oeste de EUA. LA empresa, con centros de datos en San Diego y Baltimore –este último el principal—debió correr para asegurarse que había suficiente espacio en disco en la costa este para respaldar los datos y aplicaciones ubicadas en el centro de datos de California. Aunque la historia luce como un “caso de éxito” la verdad es que si el proceso debe ser iniciado manualmente y los chequeos de espacio de disco y el inicio de transferencia de datos y aplicaciones depende de decisiones humanas en el momento del desastre, se trata meas bien de un “caso de fallo asegurado.”

    Para la empresa, al contar con dos centros de datos alejados entre sí puede sonar como protección suficiente ante imprevistos –incluyendo terremotos y maremotos—pero en la práctica si se hubiera tratado de un tsunami originado frente a las costas de California, o un terremoto en la ciudad de San Diego, los datos y aplicaciones hubieran estado en gran riesgo. Contar con estructuras separadas geográficamente entre si, no basta. Tienen que haber políticas de respaldo inteligentes, sistemas de balanceo de cargas de cómputo, esquemas de backups distribuidos y redundantes, que permitan superar una emergencia de este calibre. Sino, ¿para que invertiría en contar con dos centros de datos?

    Lo que ocurre en algunas plantas nucleares de Japón también es una lección que puede servir a la gente de TI. El reactor más afectado –el de Fukushima—se está recalentando debido a que los sistemas que bombean el líquido refrigerante están sin alimentación ya que los generadores y los generadores auxiliares se dañaron. Aunque existen estándares importantes sobre como mantener eléctricamente alimentado un centro de datos, en áreas de gran potencial sísmico, hay que elevar las consideraciones. ¡Quizás no baste con dos proveedores eléctricos independientes y una batería de generadores!.

    Con los días podremos aprender más lecciones, a medida de que se hagan públicas más anécdotas. Si usted es un CIO preocupado por los planes de contingencia de su(s) Centro(s) de Datos, esté muy atento a la prensa, que sin saberlo al contar historias de TI en Japón, estará también hablandodeti.

  • Preguntas (sin respuesta previa) para reflexionar sobre la gripe A N1H1 y la continuidad de trabajo (II)

    Preguntas (sin respuesta previa) para reflexionar sobre la gripe A N1H1 y la continuidad de trabajo (II)

    Este es un ejercicio nuevo –al menos en este blog—y quiero ayudarlos a poner en perspectiva algunas cifras e ideas.

    Haga una línea en una hoja, dividiéndola en dos columnas y anote lo que sigue:

    Piense en cuantas personas conoce con esta influenza especial y anote el número en la columna izquierda.

    Luego en la derecha anote el número de empresas que conoce que tienen un “real” plan de contingencias.

    En la izquierda de nuevo, anote el número de familiares y amigos que viajaron a México –o Estados Unidos—o viven allá. (Hágalo aún si es un habitante de México o EUA)

    En la derecha anote el número de empleados móviles que conoce, ya sea que trabajen en su empresa, o en otras empresas, sean clientes, proveedores o simples conocidos.

    A la izquierda anote las precauciones que toma para no contagiarse de la gripe, incluyendo uso de mascarillas y drogas para subir las defensas del cuerpo.

    A la derecha coloque las precauciones que usted ha tomado para garantizar que puede realizar su trabajo de manera remota, sin hacer distinción si usted es un Gerente con responsabilidad o un asalariado sin mayor responsabilidad sobre la continuidad del negocio.

    Con esta sencilla lista en mano, y recordándose lo que significa cada entrada, piense en que habría pasado –o que puede pasar—si la epidemia o pandemia se sale de control y alcanza su país, ciudad, área de trabajo o empresa –Dios no lo permita.

    Pero no solo una pandemia puede disparar la necesidad de contar con un plan de trabajo remoto. Inundaciones, nevadas, tormentas de hielo y olas de calor son algunos de los desastres naturales que pueden forzarlo a hacer uso del plan. Pero incluso una cosa tan sencilla como un escape de gas, un tubo de aire acondicionado contaminado o hasta cosas tan naturales como una mofeta o un día feriado, pueden necesitar del famoso plan.

    Es así como al hablar de continuidad de negocios se puede también estar hablandodeti.

  • Sobre la gripe porcina o cómo la Influenza A H1N1 impulsa el teletrabajo (I)

    Sentado en un aeropuerto, antes de tomar un vuelo para asistir a una conferencia tecnológica de gran tamaño –el Wireless Enterprise Simposium de BlackBerry—es inevitable pensar en la gripe porcina y sus consecuencias, cuando numerosas personas a mí alrededor –incluyendo los empleados de American Airlines que chequearon mi vuelo—portan mascarillas quirúrgicas.
    Ayer mismo una colega me plateaba el gran susto que le producía viajar a un evento semejante en la ciudad de Las Vegas.
    Y en este momento, mientras investigo en Internet sobre planes de contingencia para negocios he conseguido muchos recursos en línea, incluyendo el www.pandemicflu.gov –un sitio genial, en inglés y español, mantenido por el gobierno de los EEUUAA. Pero todos estos sitios no hacen más que señalarme, que la única solución de negocios para este caso es el teletrabajo.
    Las empresas con sólida infraestructura para facilitar el teletrabajo, podrán seguir funcionando si se desata la pandemia. Las que tengan una infraestructura que permita algunas funciones remotas –como correo e intranets—podrán mantener cierto grado operativo. Las que no tengan ninguna infraestructura que permita el trabajo remoto, la pasarán muy mal. Por supuesto que las empresas de manufactura tendrán problemas importantes, ya que el trabajo allí no puede ser remoto. Pero aún en esos casos mantener funcionando la gerencia puede evitar males mayores –por ejemplo al detener envíos de mercancía que no pueden ser procesados.
    Así que si no ha considerado hasta ahora que las ventajas del teletrabajo –mayor productividad, reducción de costos y empleados felices—sean una ventaja estratégica ara su empresa, a partir de ahora deberá considerarla por su valor estratégico en caso de crisis, especialmente de pandemias mundiales.
    Hable con sus empleados sobre la conveniencia de instaurar un régimen de teletrabajo, así sea para emergencias, y se dará cuenta de que todos estarán hablandodeti.