¿Cómo minimizar el impacto de las incidencias externas a la empresa? El enfoque de la “resiliencia operativa” que se apoya en la gestión desde la nube, brinda algunas claves para asegurar la continuidad del negocio incluso en contextos adversos.
En 2015, en el marco del Congreso de Seguridad en Cómputo celebrado en Ciudad de México, se acuñó por primera vez el término “resiliencia operativa”. Este hace referencia a “la habilidad de una organización para perseguir su misión y aprovechar oportunidades, incluso en circunstancias no idóneas o adversas como un incidente de seguridad o una crisis financiera. Esta habilidad tiene como propósito fundamental mantener los procesos de negocio y los servicios que soportan de manera directa la misión de la organización.”
De esta definición se desprende que la resiliencia operativa supone un mix de cuestiones de seguridad, continuidad del negocio y operaciones IT en ambientes dinámicos. Los cambios constantes en el entorno, en ocasiones pueden afectar el “estado ideal” de una empresa o ecosistema, y por ende suponer a priori un perjuicio si no se gestiona adecuadamente.
El objetivo de practicar la resiliencia operativa en las empresas es mantenerlas disponibles de forma permanente, incluso ante eventos inesperados o no deseados. Supone la capacidad de predecir cómo una circunstancia negativa podría afectar al conjunto de la empresa, teniendo un plan de acción y no una postura meramente reactiva a las incidencias externas.
Algunas cuestiones necesarias para llevar adelante la resiliencia operativa y asegurar así la continuidad del negocio 24x7x365 son:
-
La mejora y el fortalecimiento de la seguridad de la información.
-
La eficiencia de la operatoria IT de la empresa.
-
La evaluación de qué tan importante es proteger la infraestructura crítica de forma especial.
La gestión en la nube a través de proveedores de servicios cloud como AWS brinda herramientas y procedimientos para llevar la resiliencia operativa a la práctica y atender a las cuestiones enumeradas arriba.
Fiabilidad, resiliencia operativa y continuidad del negocio
AWS entiende por resiliencia en una carga de trabajo:
-
La capacidad de recuperación ante una interrupción de servicio y/o de infraestructura,
-
La adquisición dinámica de recursos informáticos para satisfacer la demanda de trabajo,
-
La reducción de errores variados: interrupciones, errores de configuración, problemas transitorios de red, etcétera.
En este sentido, AWS brinda herramientas y funcionalidades para adoptar un enfoque preventivo de los errores, a la vez que fomenta la agilidad y proactividad en la solución de incidencias, de modo que los efectos negativos para la operatoria general de la empresa se vean reducidos a su mínima expresión.
Al menos dos principios de fiabilidad que rigen en la nube se relacionan directamente con la resiliencia operativa para asegurar la continuidad del negocio:
-
La capacidad de recuperarse de los errores automáticamente. Esto permite la notificación automática, el seguimiento de los errores y los procesos de recuperación automatizados que solucionan o reparan los errores. Con una automatización más sofisticada, es posible anticipar y corregir los errores antes de que ocurran.
-
La prueba de los procesos de recuperación. En la nube es factible realizar pruebas para detectar de qué forma se producen errores en su carga de trabajo y puede validar los procedimientos de recuperación. Puede utilizar la automatización para simular diferentes errores o para recrear las situaciones que causaron errores anteriormente. Este enfoque expone rutas de errores posibles de probar y arreglar antes de que ocurra un escenario real de error y, de esta forma, reducir los riesgos.