FotoReportaje - Galería de fotos

Hadoop: Cómo se encuentran las distribuciones líderes

Todas las distribuciones comerciales líderes son compatibles con Apache Hadoop, entonces ¿qué las diferencia? A continuación la forma en que se comparan las distribuciones identificadas por Forrester Research como líderes.

  • Big Data y Hadoop se encuentran en el proceso de transformar las arquitecturas de la administración de datos empresariales. Es un mercado en plena ‘fiebre del oro’ con jugadores puros, proveedores de software empresarial y proveedores de nube que están todos compitiendo por un poco de participación. El proyecto de código abierto Apache Hadoop incluye los módulos principales -Hadoop Common, Hadoop Distributed File System (HDFS), Hadoop YARN y Hadoop MapReduce-, pero sin el soporte o las soluciones empaquetadas de un proveedor comercial. Todas las distribuciones comerciales líderes son compatibles con Apache Hadoop, entonces ¿qué las diferencia? A continuación la forma en que se comparan las distribuciones identificadas por Forrester Research como líderes.

    Thor Olavsrud, CIO (EE.UU.)

  • Amazon Web Services Elastic MapReduce tiene la mayor participación de mercado

    Puede que Amazon no sea la primera que aparece en nuestras mentes cuando se piensa en Hadoop, pero la Elastic MapReduce (EMR) de AWS fue uno de los primeros productos comerciales Hadoop en el mercado, y lidera en presencia de mercado global, señala Mike Gualtieri, analista principal de Forrester. EMR es Hadoop en la nube aprovechando la Amazon EC2 para cómputo, el Amazon S3 para almacenamiento y otros servicios.

    “La hoja de ruta de las soluciones de AWS incluyen la integración de EMR de Amazon con Amazon Kinesis para el procesamiento de streams; una mayor integración con el data warehouse Amazon Redshift y otras fuentes de datos; autoscaling que modificará el tamaño de los clusters en base a políticas; soporte para bases de datos NoSQL adicionales sobre Hadoop; y más integración de inteligencia de negocios con proveedores externos”, escribe Gualtieri.

    Thor Olavsrud, CIO (EE.UU.)

  • Cloudera se encuentra enfocada en la innovación en Hadoop en base a la demanda de las empresas

    AWS puede ser la líder en presencia en el mercado, pero Cloudera -compañía pura de Hadoop- es la número 2, con más de 200 clientes de paga, algunos de los cuales pueden jactarse de despliegues de más de mil nodos que soportan más de un Petabyte de datos.

    “Los clientes empresariales querían una herramienta de monitoreo y administración para Hadoop, así que Cloudera construyó Cloudera Manager”, escribe Gualtieri. “Los clientes empresariales querían un motor SQL más rápido para Hadoop, así que Cloudera construyó Impala, usando una arquitectura de procesamiento paralelo masivo (massively parallel processing - MPP), la misma arquitectura que usan los enteprise data warehouse (EDW). El enfoque de Cloudera a la innovación es ser leal con el Hadoop fundamental, pero también innovar rápida y agresivamente para satisfacer las demandas y diferenciarse de los otros proveedores”. El modelo de ingresos de Cloudera se basa primariamente en suscripciones de software, aunque también ofrece soporte.

    Thor Olavsrud, CIO (EE.UU.)

  • Hortonworks impulsa la innovación del Hadoop de código abierto

    De todos los actores del mercado, Hortonworks -otra empresa pura de Hadoop- es la que más cerca se encuentra con la comunidad de código abierto de Apache Hadoop gracias a Hortonworks Data Platform (HDP), pero también busca de manera agresiva fuertes alianzas de ingeniería con empresas como Microsoft, Teradata, SAP, Red Hat y otras.

    “La estrategia de Hortonworks es impulsar toda la innovación a través de la comunidad de código abierto y crear un ecosistema de socios para acelerar la adopción de Hadoop entre las empresas”, escribe Gualtieri. “Donde la comunidad de código abierto no se está moviendo lo suficientemente rápido, Hortonworks comenzará nuevos proyectos y comprometerá sus recursos para hacerlos surgir”.

    Apache Ambari, que proporciona una consola de administración de clusters Hadoop es un buen ejemplo.

    Thor Olavsrud, CIO (EE.UU.)

  • IBM InfoSphere BigInsights tiene tras de sí la llegada a las empresas que ofrece IBM

    IBM no tiene el arraigo sobre la comunidad Hadoop que ostentan algunos de sus competidores, pero tiene raíces profundas en la computación distribuida y en la administración de datos que le permiten ofrecer una solución Hadoop completa. Tiene más de 100 despliegues de Hadoop, algunos de los cuales corren petabytes de datos.

    “Además, IBM tiene avanzadas herramientas de analítica, una presencia global y servicios de implementación, por lo que puede ofrecer una solución de big data completa que será atractiva para muchos clientes”, escribe Gualtieri. “La hoja de ruta de IBM incluye continuar integrando la solución BigInsights Hadoop con activos de IBM relacionados como la analítica avanzada SPSS, administración de cargas de trabajo para computación de alto desempeño, herramientas de inteligencia de negocio y herramientas de administración y modelamiento de datos”.

    Thor Olavsrud, CIO (EE.UU.)

  • MapR Technologies ofrece soporte para NFS y otras innovaciones

    MapR Technologies es el tercer actor puro de la lista, pero carece de la presencia de mercado de Cloudera y Hortonworks. Inicialmente, comenzó enfocándose en las características empresariales, mientras que la mayoría de las empresas se encontraban aún evaluando Hadoop en la etapa de prueba de concepto.

    “MapR Technologies ha añadido algunas innovaciones únicas a su distribución Hadoop, como el soporte para Network File System (NFS), correr código arbitrario en el clúster, mejoras en el desempeño para HBase, así como características de alta disponibilidad y recuperación en caso de desastre”, escribe Gualtieri. El analista señala que ahora que los competidores de MapR se encuentran también firmemente enfocados en construir características empresariales, la compañía necesita enfocarse en ‘hacer ruido’ en el mercado y construir alianzas y canales de distribución.

    Thor Olavsrud, CIO (EE.UU.)

  • Pivotal Software aprovecha sus ingenieros de Greenplum

    Generada a partir de EMC y VMware, y con el CEO de VMware Paul Maritz a la cabeza, Pivotal Software tiene a los consultores técnicos y científicos de datos de EMC con ella. Además de la importante tecnología Greenplum Database que trajo de EMC, la distribución Hadoop de Pivotal tiene un motor MPP Hadoop SQL llamado HAWQ que proporciona un desempeño SQL tipo MPP a Hadoop.

    “Pivotal fue el primer proveedor de EDW en proporcionar un appliance de grado empresarial con todas las características; también fue la primera en lanzar una familia de appliances que integra su Hadoop, EDW y capas de administración de datos en un solo rack”, señaló Gualtieri. “La hoja de ruta de Pivotal hará que su solución Hadoop sea más competitiva; sus innovaciones de enfocan en mejorar el motor HAWQ SQL y la integración con otros productos de Pivotal”.

    Thor Olavsrud, CIO (EE.UU.)

  • Teradata está aprovechando su experticia en appliances Hadoop

    Teradata es un especialista en appliances para enterprise data warehouse (EDW), y ha crecido en base a ello y a una fuerte asociación técnica con Hortonworks para ofrecer Hadoop como appliance.

    “La distribución Teradata para Hadoop incluye la integración con la herramienta de administración de Teradata y SQL-H, un motor SQL federado que permite a los clientes hacer queries de datos desde su data warehouse y Hadoop”, escribe Gualtieri. “También tiene Aster para la analítica con Hadoop”.

    Teradata actualmente tiene menos de 100 clientes para su appliance Hadoop, pero Gualtieri señala que sus amplios recursos financieros, técnicos y de administración le permiten crear un appliance de alto desempeño que será difícil de igualar por otros proveedores.

    Thor Olavsrud, CIO (EE.UU.)

  • Intel ofrece un desempeño y seguridad para Hadoop mejorados por hardware

    Intel es una empresa que llegó relativamente tarde al campo de las distribuciones Hadoop, pero cuenta con las capacidades de sus chips Xeon para hacer la batalla.

    “Es el primer proveedor en entregar capacidades de desempeño y seguridad mejoradas por hardware para Hadoop”, escribe Gualtieri. “La hoja de ruta de Intel en el siguiente año la acercará o igualará con otros proveedores del mercado de soluciones Hadoop. Además, Intel continua enfocándose en las características de desempeño y seguridad mejoradas por hardware, optimización nativa de tareas, Lustre y analítica gráfica, que diferenciarán su distribución y la harán atractiva para los posibles clientes”.

    Thor Olavsrud, CIO (EE.UU.)

  • Microsoft Windows Azure HDInsight tiene tras de sí el poder de la nube y de Windows

    Diseñado como parte de una asociación de ingeniería con Hortonworks, Microsoft Windows Azure HDInsight Service está diseñado específicamente para la nube Windows Azure. HDInsight y Hadoop for Windows –una versión de Hortonworks Data Platform) componen las únicas distribuciones Hadoop que corren en una ambiente Windows.

    “Microsoft también ofrece Polybase para permitir que los clientes de SQL Server ejecuten queries que también incluyan datos almacenados en Hadoop”, señala Gualtieri. “Microsoft tiene significativos esfuerzos de ingeniería en otros proyectos de la comunidad de código abierto de Hadoop, incluyendo la siguiente generación de Hive. La significativa presencia de Microsoft en los mercados de base de datos, data warehouse, nube, OLAP, inteligencia de negocio, hojas de cálculo (PowerPivot), colaboración y herramientas de desarrollo ofrece ventajas cuando se trata de entregar un stack de Hadoop cada vez mayor a los clientes de Microsoft”.

    Thor Olavsrud, CIO (EE.UU.)

Llegamos a ustedes gracias a:

FOTO REPORTAJES

Más »
12 utilidades que le pueden dar más control sobre su PC

12 utilidades que le pueden dar más control sobre su PC

Monitoree y gestione todos los aspectos de su PC de Windows.
Primer vistazo: Samsung Galaxy S8

Primer vistazo: Samsung Galaxy S8

Samsung ha lanzado su nuevo teléfono inteligente Android, su buque insignia, el Galaxy S8 -dele un vistazo.
Muy buenas aplicaciones de Google que no sabía que necesitaba

Muy buenas aplicaciones de Google que no sabía que necesitaba

Todos los teléfonos Android vienen con un grupo de aplicaciones preinstaladas de Google, pero éstas las tendrá que descargar de Google Play.
8 herramientas de prueba para desarrolladores de aplicaciones móviles

8 herramientas de prueba para desarrolladores de aplicaciones móviles

Están surgiendo herramientas y servicios de nube para ayudarle a que sus aplicaciones operen sin problemas en todos los dispositivos.