Llegamos a ustedes gracias a:



Columnas de opinión

Amazon, la madre de todas las nubes

Por: Peter Wayner, InfoWolrd (EE.UU.)

[05/04/2013] Ah, Amazon, ¿Acaso Jeff Bezos eligió ese nombre para simbolizar a la librería más grande del mundo, o se dio cuenta de que algún día crearía un servicio de nube tan grande y complejo como la cuenca del río al que hace alusión? Después de pasar algún tiempo con su servicio de infraestructura para empresas, creo que él lo veía venir.
La venta de servidores era una idea audaz cuando el negocio en la nube de Amazon se lanzó hace unos años, pero eso parece extraño en comparación con todas las opciones a la venta de hoy. En la actualidad hay 21 productos disponibles en Amazon Web Services, y solo uno de ellos es la clásica máquina EC2, una abreviatura de su nombre completo en inglés, Elastic Compute Cloud. El S3 (Simple Storage Service) original ahora tiene primos, como Simple Workflow Service y SimpleDB, un almacén de datos no relacionales. Luego están las más extrañas innovaciones como Amazon Glacier, una solución de almacenamiento muy barata que se toma horas para recuperar los datos. Sí, horas. No milisegundos, segundos, ni minutos, sino horas.
Es imposible resumir todo en un párrafo o incluso en un artículo. Amazon Web Services requeriría un libro, pero ese tomo estaría desactualizado para el momento en que se imprima, porque el servicio cambia rápidamente. La mejor noticia es que Amazon está constantemente revisando costos y buscando la forma de bajar los precios en general, para entregar el producto por menos. Algunos precios han subido de vez en cuando con los años, como un esfuerzo para que los precios reflejen la realidad.
Amazon también ha encontrado muchos seguidores. Una serie de grandes empresas como Netflix están orgullosas de usar los servidores de Amazon, y un gran número de nuevas empresas están orgullosas de no tener que establecer sus propios centros de datos para alcanzar el anillo de oro de las riquezas de la IPO. Algunos clientes alardean gastar un millón de dólares o más al mes, una cantidad que sería más que suficiente para que la mayoría de las empresas justifiquen la creación de un centro de datos y equipo internos. Claramente, Amazon está entregando una gran cantidad de valor.
Una mezcla heterogénea de posibilidades
La gran variedad de opciones es probablemente lo que hace que la gente se mantenga en Amazon. Cuando comencé la creación de unas cuantas máquinas de prueba, estaba claro que Amazon había ampliado las opciones al punto que ya no parecían commodities. Hay por lo menos 16 tamaños distintos de máquinas. Los casos generalmente agrupan más RAM con más núcleos de CPU y más espacio en disco, pero también puede optar por versiones asimétricas que son más pesadas en la RAM, la CPU o la I/O.
El tamaño es solo la primera característica que debe elegir. Hay almacenamiento de back-end que se puede montar, y puede jugar con la cantidad de espacio en disco. Si lo desea, puede agregar EBS (Elastic Block Store), que es el espacio en disco que vive en los bastidores cerca de usted. Esto puede ser más rápido o más lento y respaldado por más o menos protección RAID.
Hay tantas opciones que hacer funcionar una máquina de Amazon es casi tan complicado y flexible como la compra de un servidor personalizado. Se parece un poco a una tienda de juguetes porque hay que resistir la tentación de jugar con la tecnología de vanguardia -como una de las máquinas llenas de GPUs Nvidia Tesla listas para ejecutar algoritmos altamente paralelos escritos en la plataforma CUDA de Nvidia. La mente a menudo se perturba por estas cosas.
El panel de control de Amazon EC2 hace un seguimiento de la vida de la máquina y le permite conectarse directamente a la instancia a través de una versión de SSH basada en Java.
Descifrar el listado de precios requerirá algún tipo de colaboración entre el CFO y el CIO. No solo hay 16 máquinas de diferentes tamaños, sino que puede pagar con anticipación para reservarlas. Si paga por adelantado una parte, Amazon reducirá el precio de la hora a lo largo del camino. Es algo así como uno de esos clubes de almacenes donde compra una membresía y obtiene un descuento. Si es juicioso probablemente vale la pena, pero va a tomar algún tiempo predecir cuánto tiempo va a usar las máquinas.
Las opciones no solo se dan en el tamaño o la configuración de la máquina. El proceso de inicio ofrece una serie de opciones más sofisticadas para la personalización de la distribución desde el principio. Puede, por ejemplo, crear un "perfil de seguridad" que controla inmediatamente qué puertos están abiertos y cerrados. Esto le ahorra el problema de registrarse después de crear y configurar los puertos manualmente, una característica que es esencial si va a iniciar y detener a docenas, cientos o miles de máquinas.
Evaluación comparativa de la nube
Pasé algún tiempo haciendo puntos de referencia del modelo de micro máquina de gama baja de Amazon, que se supone es capaz de manejar ráfagas de computación extrema. Está dirigido a personas que están probando algunas ideas o construyendo una máquina de bajo tráfico. Su precio es de solo dos centavos de dólar por hora y viene con 613MB de RAM, un número impar que es probablemente una fracción de alguna potencia de dos, menos una pequeña sobrecarga.
Fue sorprendentemente difícil encontrar una manera de entrar en las máquinas. No pude obtener las claves públicas/privadas generadas por Amazon para que funcionen con PuTTY o el cliente integrado basado en Java SSH. Sin embargo, trabajó en segundos desde mi terminal Mac. Me pregunto qué tipo de computadoras portátiles son populares en Amazon.
Pequeños problemas como este aparecieron varias veces durante el tiempo que pasé hurgando en la nube. El portal web de Amazon es una de las herramientas disponibles más sofisticadas, ya que ofrece diagnósticos más amplios y ayuda en línea que no ofrecen sus competidores, pero no siempre es infalible.
Por ejemplo, ofrece un bonito cuadro de diálogo para ayudarle a conectarse de inmediato a su instancia con el SSH dándole formato a la línea de comandos. Para mí, funcionó la mayoría de veces, pero fracasó cuando trató de hacerme entrar a una de mis instancias Ubuntu como root, un problema que tardó cinco segundos en arreglarse una vez que recordé que tenía que ingresar como "ubuntu". Cualquier usuario Unix debería ser capaz de evitarse todos estos diminutos problemas técnicos. De hecho son solo perceptibles porque Amazon establece una valla muy alta con la calidad de su portal.
La velocidad que vi en las máquinas no era muy emocionante. Traté los puntos de referencia de DaCapo Java, un conjunto de pruebas que incluye varias tareas computacionalmente intensivas, como correr un servidor Tomcat. Los resultados fueron generalmente de tres a cinco veces más lentos que en las máquinas de gama baja de Windows Azure (Microsoft) y, a menudo seis a nueve veces más lentos que en las máquinas de gama baja de la nube Joyent. Sin embargo, estas cifras no eran perfectamente coherentes. En la simulación Avrora de una red de sensores, la micro máquina EC2 fue más rápida que Joyent, y se tomó solo 45% más tiempo en terminar que la máquina Azure de gama baja.
Las instrucciones de Amazon para configurar una bóveda Glacier, una solución de almacenamiento de bajo costo que se toma horas para encontrar los datos.
 
Las máquinas de Joyent tienen un precio de alrededor de tres centavos de dólar por hora, una prima pequeña teniendo en cuenta la diferencia en el rendimiento. Las máquinas Azure tienen un precio de lanzamiento de 1,3 centavos de dólar por hora -más barato que las micros de Amazon, aunque son mucho más rápidas.
Más grande, más rápido, más
Para la comparación, también arranqué lo que Amazon llama una máquina de alto CPU que ofrece dos núcleos virtuales, donde cada cual entrega 2,5 (en la jerga de Amazon) ECUs o Elastic Compute Units. Son cinco ECUs todas juntas. Se supone que la máquina micro ofrece dos ECUs en ráfagas, mientras que la máquina CPU de gama alta ofrece cinco ECUs todo el tiempo. El precio es mucho más alto - 16,5 centavos de dólar por hora- pero eso incluye 1,7GB de RAM. Una vez más, ¿qué pasó con nuestros viejos amigos, los poderes de dos?
La máquina de CPU de gama alta es generalmente de seis a ocho veces más rápida que la máquina micro, lo que sugiere que las ECUs son solo una medida aproximada. Los resultados estuvieron cercanos a la velocidad de la máquina Joyent y, a menudo un poco más rápido, pero con un precio cinco veces más alto. Para los nerds de los algoritmos vale la pena señalar que los puntos de referencia DaCapo utilizan dos hilos en la máquina de Amazon cuando les es posible, pero se limitaron a un hilo en Joyent y Azure.
Una vez más, esto sugiere que el diseñador de algoritmo, el maestro de construcción, y el director financiero o CFO van a tener que sentarse y decidir si comprarán máquinas más rápidas y grandes por más dinero o vivir con un mayor número de máquinas más lentas, más baratas.
Hay más diversión cuando comience a explorar las otras esquinas de la tienda de juguetes de Amazon. La nube de pague lo que consuma Hadoop, llamada Elastic MapReduce, le permite cargar un archivo JAR, apretar un botón y empezar a girar las ruedas de cálculo. Usted pega los datos en la nube de almacenamiento de Amazon, S3, y los resultados se muestran allí cuando todo está hecho.
Hay una nube separada de máquinas dedicadas a hacer el procesamiento de Hadoop. Por lo menos se ve separada, ya que los ciclos de cálculo se compran a través de una página web diferente, pero todo podría estar funcionando en la misma red flotante de máquinas. Ese es el punto.
Si desea que su trabajo Hadoop empiece tan pronto como esté disponible una máquina, usted paga el precio de lista. Si quiere jugar un poco y esperar por las máquinas vacías, el mercado le permite poner en una oferta más baja y esperar a que las máquinas de repuesto estén disponibles por ese precio. Amazon constantemente está experimentando con subastas de poder de cómputo. Este es otro tema para que los ingenieros y los contadores pasen el tiempo discutiendo.
Más allá de la mercantilización
Mi característica favorita, relativamente nueva es Amazon Glacier, un sistema de copia de seguridad que toma horas para recuperar los datos. Mucha gente vio la primera solución de almacenamiento en la nube (S3) de Amazon y le pareció que era demasiado cara para las copias de seguridad u otros datos que no se acceden con frecuencia. Una talla única para todas las soluciones es una de las limitaciones de la nube. Amazon diseñó S3 para satisfacer las necesidades de los servidores que deben acceder a datos de forma relativamente rápida.
Como ya he dicho antes, no es fácil cubrir la totalidad de Amazon Web Services en un artículo como éste. La única solución es empezar a arrancar máquinas y comenzar a probar su aplicación. Amazon ofrece servicios muy básicos de forma gratuita para ayudar a los nuevos clientes, pero en su mayor parte probar los diferentes tamaños solo cuesta unos pocos centavos. Entonces puede sentarse con su contador y empezar a fijar el precio de los servicios.
Mi impresión es que la nube de Amazon se ha convertido en el Cadillac de gama alta. Ofrece una amplia documentación, más enganche y características más sofisticadas que sus rivales, todo ello a un precio que es superior a la competencia. Tal vez las tasas de la competencia son solo temporales y tal vez son insostenibles, pero a lo mejor la tasa de Amazon es el precio que se paga por todas las características adicionales. La nube de Amazon está cargada de ellas.
Peter Wayner, InfoWolrd (EE.UU.)