Llegamos a ustedes gracias a:



Reportajes y análisis

Cómo sobrevivir a una interrupción de la nube

[05/08/2011] El famoso corte de la nube de Amazon en abril se trajo abajo a varios sitios web populares, incluyendo Foursquare y Reddit, pero muchos de los clientes de la nube Amazon Enterprise fueron capaces de capear el temporal sin sufrir tiempo de inactividad.

Ellos construyeron sus sistemas para la resistencia, mediante el uso de múltiples zonas de disponibilidad, con copias de seguridad en los centros de datos tradicionales, o teniendo un proveedor en la nube de copia de seguridad configurado y listo para funcionar en caso de problemas.

La empresa de intercambio de fotos SmugMug, con sede en Silicon Valley, permaneció en pie durante el corte aun cuando sus compañeros no. Esto fue en parte debido a que evitó usar el Elastic Block Storage de Amazon -que fue el componente en particular que cayó.

Pero la empresa también extendió sus sistemas a través de varios centros de datos de Amazon -lo que Amazon llama "zonas de disponibilidad".

Otras compañías hubiesen quedado en pie si también hubieran distribuido sus aplicaciones, señala el CEO de SmugMug Chris MacAskill. Quien también recomienda a las empresas que utilicen varias regiones de Amazon, que están más aisladas unas de otras que las zonas de disponibilidad. Por supuesto, Amazon cobra extra por utilizar varias zonas, por lo que es algo que debe cuantificarse.

SmugMug depende en gran medida de Amazon, ya que utiliza su Simple Storage Service (S3) basado en la nube para almacenar fotos y videos de los clientes. SmugMug también utiliza muchas instancias de la nube Elastic Compute (EC2).Pero en lugar de utilizar el almacenamiento de bloques elásticos (Elastic Block Storage) -que se adjunta a las instancias individuales EC2, y se utiliza con frecuencia para almacenar datos de funcionamiento- la compañía sigue utilizando los centros de datos tradicionales.

Eso tiene también sus desventajas -la semana del corte de Amazon, por ejemplo, la compañía perdió un router del núcleo, su copia de seguridad, y un servidor maestro de base de datos central. "Me gustaría ya no tener que lidiar con los routers de la base de datos o las fallas de hardware, que es por lo que todavía estamos marchando hacia la nube", señala MacAskill.
Y, a pesar de la interrupción, los servicios basados en la nube que obtiene de Amazon son aún mejores que lo que SmugMug podría tener por su cuenta, añade, y mejores que los de otros proveedores de servicios cloud. "Estamos muy comprometidos con ellos", apunta.

La joven empresa Kitely Ltd, con sede en Israel, solo ha utilizado una de las zonas de disponibilidad de Amazon -pero, afortunadamente, no la que cayó.

Sin embargo, la compañía planea aprender de la experiencia. "Tenemos la intención de dividir todos nuestros servicios a través de las múltiples zonas de disponibilidad", señala el CTO de Kitely, Oren Hurvitz.

Kitely, que ejecuta reuniones virtuales y entornos de colaboración en la nube basados en la plataforma OpenSim, también realiza controles continuos para evitar que todos sus servicios estén en funcionamiento.

"Nuestro sistema está diseñado con la premisa de que cualquier servicio puede dejar de funcionar en cualquier momento", agrega. "Si descubrimos que un servidor no responde entonces lo apagamos y comenzamos con un servidor nuevo en su lugar".
Otra empresa que no fue afectada por el apagón debido a que usa múltiples zonas de disponibilidad fue Mashery, que proporciona API a más de cien empresas como Best Buy, Hoovers y The New York Times. Pero Mashery también tiene otro plan de copia de seguridad -un centro de datos tradicional.

"Nos dimos cuenta de que podría haber un problema con el servicio, en el que Amazon no estaría totalmente disponible, y decidimos que necesitábamos infraestructura para cuando ocurriera un error", señala el CEO de Mashery, Oren Michels. "Hemos dedicado hardware con Internap".

Internap Network Services Corp., con sede en Atlanta, ofrece no solo un sitio de respaldo para Mashery, sino también un entorno de producción para clientes que necesitan la menor latencia posible con una nube, o servicios en las áreas geográficas en las que Amazon no está disponible. "Mantenemos mucha infraestructura en ambos lados para manejar picos de carga", agrega.

Cuando Mashery estaba construyendo su primera infraestructura en la nube hace dos años, Amazon era el único jugador real en el negocio. Hacer una copia de seguridad en otra nube no era una opción en ese entonces, pero podría ser posible ahora.

"Definitivamente estamos manteniendo nuestros ojos en eso", agrega. "Pero sino está roto, no lo arregle. Amazon ha funcionado sorprendentemente bien para nosotros. Asimismo, Internap ha sido un gran socio y continua proporcionándonos los servicios que necesitamos".

Incluso Internap ha bajado sus precios para mantener su competitividad, añade, aunque el precio no es el factor más importante en su toma de decisiones.
"Tenemos a un centenar de marcas grandes como clientes", señala. "Es más caro perder clientes en caso de que sus cosas caigan. Nuestros clientes nos pagan para resolver sus problemas de API, y eso incluye mantenerse si hay un corte de luz".

Las empresas que están haciendo la transición hacia la nube a menudo utilizan los centros de datos tradicionales como copias de seguridad en el inicio del proceso, señala Rob Enderle, analista de la firma de investigación Enderle Group.

"Puede tener un conjunto de recursos menores que están en stand-by y que puede conmutar por error", agrega. "A menudo, eso es todo lo que hay antes de mudarse a la nube. Puede conmutar por error una tecnología de bajo rendimiento y todavía mantener a sus clientes".

Las empresas que tienen algunas aplicaciones ejecutándose en un centro de datos tradicional y algunos corriendo en la nube, pueden ser capaces de duplicarse, señala; y utilizar el mismo sitio de recuperación ante desastres para ambos, ya que las probabilidades de que Amazon y el centro de datos tradicional caigan en el mismo momento son bajas.
Sin embargo, advirtió que no hay que confiar demasiado en el uso de un conjunto de servicios en la nube, como una copia de seguridad de otra serie de servicios en la nube en la misma nube.

"Un servicio redundante podría utilizar algunos de los mismos recursos que el primer servicio", agrega. "Se debe tener cuidado para asegurarse de que los despidos son, de hecho, redundantes y no simplemente un nombre diferente para la superposición de hardware y software".
Proveedores cloud secundarios
El uso de un proveedor de servicios en la nube como una copia de seguridad de un centro de datos tradicional, suele ser más rentable que a la inversa.

Eso es porque con un proveedor de servicios en la nube, usted paga por los ciclos de computación. Cuando no se está usando, los clientes solo necesitan tener el mínimo poder de cómputo operando para permitir una conmutación rápida, y luego añadir más capacidad a los servidores según sea necesario.

Con un centro de datos tradicional, los servidores tienen que estar disponibles para manejar la máxima carga de trabajo, incluso si se usan muy poco. Eso se traduce en costos de hardware, así como en los requisitos de energía y de personal -por lo general un centro de backup tradicional duplicaría los costos totales de computación, mientras que una copia de seguridad cloud solo añadiría una fracción.
Por ejemplo, el proveedor de encriptación de disco basado en la nube, AlertBoot, con sede en Las Vegas, solía pagar 50 mil dólares al mes solo por electricidad, señala el CEO de AlertBoot, Tim Maliyil.

"Teníamos dos centros de datos físicos en un punto -y no sabe lo feliz que nos hizo cerrarlos", agrega. "Ahora, dos nubes, ancho de banda y hospedaje son 16 mil dólares al mes. Había mucho despilfarro de la electricidad y la capacidad. La nube realmente ha minimizado los costos y gastos en curso".

La transición hacia los proveedores de nube no fue difícil, porque AlertBoot ya estaba usando el software de virtualización de VMware en su centro de datos tradicional, agrega. Los dos proveedores de la nube que la compañía escogió son SunGard y OpSource, ya que ambos utilizan la tecnología de VMware. (El integrador de sistemas Dimension Data anunció recientemente que planea adquirir OpSource.)
Cambiar de un proveedor cloud a otro ahora toma solo un minuto o dos, señala, y la nube de copia de seguridad puede acelerarse rápidamente para manejar el aumento de carga. La transición en sí está a cargo de un servicio de Zeus Technology, un proveedor del Reino Unido que ayuda a que las empresas muevan sus aplicaciones de una nube a otra.

Maliyil señala que su compañía eligió a esos vendedores, por ser conocidos por su fiabilidad a nivel empresarial. "Por el tipo de negocio en el que estamos, y la falta de tolerancia al fracaso de nuestros clientes, nos hemos apartado de la infraestructura de Amazon", señala.

Otro proveedor que ayuda a las empresas a gestionar los servicios que se ejecutan en múltiples nubes es rPath, que tiene más de 90 clientes corporativos, en su mayoría grandes empresas y proveedores de Internet, incluyendo ADM, Fujitsu, Qualcomm y EMC.
Actualmente, la empresa despliega16 tipos de formatos de imagen, que son instantáneas de aplicaciones que se ejecutan en entornos cloud. Añadir otra nube a la lista suele tardar menos de una semana, señala Jake Sorofman, director de marketing de rPath. "Es bastante trivial para nosotros".

Actualmente, la compañía da soporte a Amazon EC2, VMware, Citrix Zen, Microsoft HyperV, Rackspace y otros formatos. Una vez que una aplicación está en el sistema de rPath, toma tan solo 15 minutos para generar una nueva imagen y desplegarla a una nueva nube, señala.

Sin embargo, la arquitectura y aplicación para el sistema rPath en primera instancia puede tardar un poco más. "El proceso de envasado de una nueva aplicación para nuestra plataforma puede tomar desde un par de horas hasta un par de días, dependiendo de su complejidad", agrega. "Pero tenemos un equipo de servicios profesionales que hace el trabajo por los clientes, si así lo desean."
Muchas aplicaciones ya están empaquetadas, agrega, incluyendo toda la gama de sistemas operativos Windows y Linux, WebSphere y WebLogic, SAP, EMC y productos de RSA.

"Hay una lista bastante extensa de pilas completas que ya han sido modeladas utilizando nuestra tecnología, y que pueden ser aprovechadas", comenta.

Y tener la opción de mover las aplicaciones entre las nubes hace más que proporcionar opciones de copia de seguridad para las empresas, añade, pues también permite que las empresas consigan las mejores ofertas posibles de sus proveedores.

"Hay una oportunidad de arbitraje que viene con tener el poder de elegir", señala. "Ser capaz de optimizar las cargas de trabajo donde se están ejecutando en función del rendimiento, la política y el precio. Y, en la medida en que usted pueda mover fácilmente una carga de trabajo entre Amazon, Rackspace y otros ambientes, tiene influencia sobre sus proveedores de servicios, ya que han eliminado el bloqueo".
Maria Korolov, Network World (US)