Llegamos a ustedes gracias a:



Reportajes y análisis

¿Qué significa para TI la llegada de Open Source Hadoop?

[07/06/2013] El análisis de Big Data se ha disparado en el escenario de negocios en los últimos 12 meses más o menos, y una de las más grandes plataformas de análisis de Big Data es el proyecto de código abierto Apache Hadoop. Generalmente corre en Linux y es usado por grandes compañías, incluyendo a Yahoo, Facebook y Twitter.
Plataforma de Datos Hortonworks (HDP) para Windows
Lo que está a punto de cambiar en los próximos meses es que Hadoop está llegando a Windows en la forma de Hortonworks Data Platform (HDP) para Windows, una distribución de Hadoop de código abierto totalmente soportada que corre en Windows Server. Horton, una compañía establecida en California, es patrocinador y contribuyente del proyecto Apache Hadoop, y ya ofrece su distribución HDP basada en Linux en forma comercial.
Esto abrirá Hadoop a un gran número de organizaciones que no tienen en casa las habilidades de Linux. Shaun Connolly, vicepresidente de Estrategia Corporativa de Hortonworks, explica el pensamiento detrás del movimiento de HDP hacia Windows de esta manera: "En esencia, se trata de una decisión impulsada por el mercado", señala. "Hadoop se ha creado para el crecimiento del mercado de hardware de commodity, y este mercado es de 70% Windows, según la base instalada y según el expertise".
Las compañías que solo tienen empleados en Windows podrán hacer uso de Hadoop fácilmente porque Excel se puede utilizar como una herramienta de inteligencia de negocios para ver los resultados de Hadoop de análisis de Big Data (aunque Hadoop se esté ejecutando en Windows o Linux). "De manera ideal queremos que los usuarios de Microsoft sean ajenos al hecho de que todo viene de Hadoop, señala Connolly. Si los usuarios finales pueden consumir datos sin ninguna curva de aprendizaje, gracias a herramientas como Excel, entonces obtendrán mayor valor.
Los departamentos de Windows también podrán beneficiarse de Hadoop en Windows, ya que el personal con las habilidades de Windows, será capaz de escribir aplicaciones utilizando Hadoop VisualStudio de Microsoft y el framework .Net, sin necesidad de ningún conocimiento Linux. (Dicho sea de paso, ambas ofertas de Windows de Hortonworks y de Microsoft son 100% Apache Hadoop -no han tenido ajustes al código- así que cualquier app de Linux Hadoop puede ser fácilmente llevada a Windows, señala Connolly).
Pero resulta que el HDP para Windows no es la única manera de que Hadoop está llegando a Windows. Microsoft ha estado trabajando tras bambalinas con Hortonworks desde finales del 2011, y el gigante de Redmond está a punto de lanzar su propia distribución de Hadoop que llama HDInsight. Esta estará disponible como un servicio que se ejecute en la nube de Azure de la compañía, o como un producto que está destinado a ser utilizado como base de una instalación de Hadoop en nube privada on-premise.
Hace una década Microsoft era resueltamente contraria al software de código abierto, e irónicamente, puede ser que su apoyo a Hadoop se derive de esta vieja animosidad, según Wes Miller, analista de Directions on Microsoft. "Creo que parte de la razón por la que Microsoft quiere Hadoop en Windows, es debido a la preocupación acerca de la competencia que plantea Linux", comenta.
Pero hay otra razón para ello, señala. "La compañía además quiere asegurarse de que si hace uso de Hadoop, también pueda utilizar la pila de BI de SQL para la parte de inteligencia de negocios".
Tres maneras en que las empresas comprarán y utilizarán las capacidades de Hadoop en Windows
* Windows Azure HDInsight Service (en preview pública): Una nube basada en Hadoop como servicio, disponible a través de Windows Azure.
* Hortonworks Data Platform (HDP) para Windows (actualmente en beta): Una distribución de Hadoop open source Hadoop disponible desde Hortonworks y que corre directamente en un servidor Windows, con soporte proporcionado por la compañía basado en suscripción.
*  Microsoft HDInsight Server para Windows (en preview pública): Una distribución Hadoop basada en Windows diseñada para trabajar en un ambiente de nube privado y virtualizado, usando Hyper-V de Microsoft y el sistema de administración System Center. Será soportado por Microsoft, con un soporte de tercera línea provisto por Hortonworks.
 
La opción rápida y fácil es utilizar el servicio de Azure, según Eron Kelly, director general de marketing de producto de plataforma de datos de Microsoft. "Esta es una forma ideal de consumir tecnología Hadoop, ya que puede ser complicado de que funcione con proyectos de código abierto", señala. "Con Azure esto se puede hacer en un par de clics y luego pagar por lo que usa".
Las empresas no tienen otras opciones para acceder a Hadoop en la nube, mediante la ejecución de Hadoop en la nube de Amazon o Rackspace, por ejemplo. Pero para las empresas que ya utilizan Azure, con grandes cantidades de datos (y registros) en la nube, el servicio HDInsight ciertamente parece tener sentido.
Para las empresas que quieren gestionar y ejecutar su propia instalación de Hadoop, HDP para Windows es probablemente la opción a elegir -siempre y cuando ellos tengan sus propios servidores Windows y se preparan para instalar el software y ponerlo en marcha. El soporte está disponible desde Hortonworks. "Esto podría ser atractivo para las empresas que por lo general no han tenido ninguna política de software de código abierto (en Linux). El tipo que puede haber querido Hadoop, pero que solo lo quería en Windows", señala Wes Miller.
HDInsight Server para Windows permitirá a las grandes empresas aprovechar su inversión existente en el conjunto de software de Microsoft -en particular las capacidades de gestión de nubes de System Center- para incorporarlo en una nube privada. Y no tiene por qué ser caro -el producto está disponible como una descarga gratuita, explica Kelly.
"No hay cuota gradual para el uso del servidor HDInsight para Windows -vamos a obtener beneficios económicos de los clientes que tengan que comprar Windows Server para utilizarlo- y tal vez también de ellos mismos mediante nuestro almacenamiento de datos o entornos de BI", señala. "También podemos obtener beneficios económicos mediante la venta de nuevas versiones de Excel", añade. (Microsoft ofrece una adición a Excel 2013 y 2010 llamada Explorador de datos que puede conectarse a instancias HDInsight en Azure o en las instalaciones internas).
La gran interrogante sobre HDInsight Server para Windows es si alguna empresa, excepto las más grandes, en realidad quiera usarlo. Miller teme que pueda ser demasiado complicado. "¿Querrán realmente las empresas de menor tamaño ejecutar Hadoop en una nube privada? Tal vez si todo está automatizado, pero no creo que Microsoft vaya a hacer eso", señala.
No hay duda de que la llegada de Hadoop a Windows es importante, porque pondrá el análisis de Big Data al alcance del vasto mercado de Windows. (Shaun Connolly, de Hortonworks, estima que mediante la liberación de HDP para Windows, la empresa duplicará el mercado potencial de HDP inmediatamente). Y al disminuir las barreras de entrada para hacer uso de Hadoop, las organizaciones más pequeñas, e incluso departamentos de negocios de la empresa, serán capaces de beneficiarse de conocimientos obtenidos a partir del análisis de Big Data.
Paul Rubens, CIO (EE.UU.)