Llegamos a ustedes gracias a:



Noticias

El big data tiene ahora especificación de tiempo de ejecución

[31/03/2016] La Open Data Platform Initiative (ODPi) lanzó su primera ODPi Runtime Specification y suite de prueba el lunes como parte de su objetivo de asegurar un modelo estándar de despliegue para aplicaciones empresariales de big data en las distribuciones Apache Hadoop.

"Esta es la culminación del trabajo de todo este año, afirma John Mertic, gerente senior de ODPi.

La ODPi, que es una institución sin fines de lucro, formó el año pasado una iniciativa para reducir la complejidad alrededor de Hadoop y del entorno de big data. La idea era proporcionar un kernel de big data en la forma de un núcleo de referencia probado de Apache Hadoop, Apache Ambari y artefactos fuente Apache relacionados.

El kernel, llamado ODPi Core, sería usado para simplificar las iniciativas de calificación upstream y downstream -una plataforma core tipo "pruebe una vez, use siempre que podría eliminar la creciente fragmentación en el campo. Las aplicaciones y herramientas construidas sobre la plataforma de referencia deberían integrarse con- y funcionar en -cualquier sistema compatible.

En setiembre del año pasado, la ODPi oficialmente se convirtió en un proyecto colaborativo de la Fundación Linux.

Mertic explica que la ODPi es un esfuerzo para reunir a los componentes de todas las distintas "líneas con participación en el ecosistema del big data.

"Lo que realmente queríamos hacer era asegurarnos de que podríamos tener a la comunidad bien representada, afirma. "El mayor feedback que conseguimos fue que cada distribución hace las cosas un poco diferentes; nombra sus archivos diferentemente; sus API se comportan de manera diferente.

La nueva especificación de tiempo de ejecución proviene de Apache Hadoop 2.7 y presenta componentes HDFS, YARN y MapReduce. Mertic afirma que el marco de evaluación y autocertificación se alinea estrechamente con la Apache Software Foundation al aprovechar Apache Bigtop para ofrecer un empaquetado, evaluación y configuración completos. Más de la mitad del código de la más reciente versión de Bigtop se originó en ODPi. Las pruebas ODPi Runtime-Compliance están vinculadas directamente a las líneas en la ODPi Runtime Specification. Para ayudar con el cumplimiento, ODPi ha proporcionado también una compilación de referencia.

La organización afirma que la especificación publicada incluye reglas y pautas sobre cómo incorporar funciones adicionales, funciones de no separación, que se proporcionan dado que el código fuente está disponible a través de procesos relevantes de la comunidad de Apache.

Con la Runtime Specification ya en el campo, Mertic afirma que el siguiente punto de interés será la ODPi Operations Specification para ayudar a las empresas a mejorar la instalación y administración de Hadoop y aplicaciones basadas en Hadoop. Cubre Apache Ambari, que se usa para provisionar, administrar y monitorear clusters Hadoop. Mertic espera que la Operations Specification se encontrará lista para el verano septentrional.

La ODPi también se está alistando para decidir en qué enfocarse luego de eso. Mertic explica que cada miembro de la ODPi, sin importar su tamaño o inversión, tiene exactamente un voto. Algunas posibilidades incluyen trabajar en torno a Spark, Kafka, HBase y Hive.