Anoche hubo una caída generalizada en muchas webs españolas debido a un incendio en un datacenter en Alcobendas, Madrid. Las instalaciones de Telven alojan multitud de servidores web en sus instalaciones, dando total conectividad a Internet a través de varios enlaces de salida.
Por cuestiones profesionales, tengo acceso a edificios que albergan electrónica vital en las telecomunicaciones de este país y si las cosas están bien planificadas, las alarmas saltan a tiempo y con suficientes medidas de contingencia y seguridad se pueden atajar los problemas. En este caso parece que hubo algún problema con una máquina de aire acondicionado que además fue agravado por el hecho de que no funcionara bien el sistema de backup (todo según las pocas noticias filtradas).
El caos es que este tipo de emplazamientos debe tener:
- Altas medidas de seguridad en cuanto a accesos físicos de personas
- Altas medidas de seguridad en cuanto a accesos indeseados electrónicos
- Sistemas de backup de acceso redundantes
- Sistemas acondicionados redundantes
- Limpieza completa de las instalaciones
- Plan de pruebas periódicos
- Planes de contingencia ante cualquier problema
- Vigilancia 24horas / 365 días de instalaciones y sistemas
- Personal cualificado y con conocimientos renovados.
- Revisiones periódicas de todos los sistemas
- Sistemas de alarmas que recojan cualquier fallo en relación a los sistemas anteriores.
- Procedimientos de resolución de problemas y total comunicación entre distintos niveles de soporte.
- Balancio de servicios tanto electrónicos como geográficos (otros emplazamientos físicos).
Los tiempos de respuesta ante cualquier incidencia deben ser inferiores a 2 horas, permitiendo solventar el problema lo antes posible y minimizando los problemas. Al final, cualquier caída del servicio tiene una repercusión directa en el tema económica, a parte de generar miedo a los clientes que hacen uso del servicio.
En el momento que surja un problema, se debe avisar a los niveles de soporte adecuados, permitiendo interactuar con los usuarios correspondientes y proporcionando respuestas inmediatas. Para ello es indispensable siempre disponer de nombres, apellidos y teléfonos de las personas implicadas en cada sector.
Está claro que ayer Telven tuvo mas de un problema en cualquiera de los puntos anteriores, pero mas grave aún es la falta de seguridad y que me han sorprendido bastante de las empresas allí alojadas.
Por ejemplo, ya.com alberga (por lo que parece) sus servidores de resolución de DNS en un único datacenter o al menes todos sus DNS dependen de algún servicio que está alojado en Telvent. Una empresa que ofrece servicio de Internet a miles de usuarios debe tener previsto esto, aprovisionando sistemas de balanceo electrónico y geográfico.
Parece mentira, pero Real Madrid, Libertad Digital, COPE ó Spanair hayan tenido problemas de acceso a sus páginas web por estar alojadas en dichos servidores. En cuanto una empresa de cierta importancia tiene una página web, debe proporcionar alternativas de conexión ante caídas de un datacenter (por ejemplo).