Llegamos a ustedes gracias a:



Noticias

Oracle devuelve el big data a los administradores de bases de datos

[09/04/2015] Ahora que muchas empresas están viendo el valor del análisis del big data, podría ser el momento de que se involucren sus administradores de bases de datos y sus administradores de data warehouse.

Oracle ha lanzado una nueva extensión para su middleware Oracle Data Integrator que permite a los administradores de bases de datos y a los expertos en data warehouse tratar los repositorios de big data como otra fuente de datos, junto con sus bases de datos estructuradas y data warehouses.

El Oracle Data Integrator for Big Data "hace que un desarrollador que no es de Hadoop instantáneamente sea productivo en Hadoop, sostuvo Jeff Pollock, vicepresidente de product management de Oracle.

Las plataformas de big data como Hadoop y Spark inicialmente fueron creadas pensando más en los programadores que en los administradores, usando lenguajes como Java y Python, sostuvo Pollock. El análisis tradicional de los datos empresariales en gran medida ha sido llevado por los administradores y expertos en ETL (Extract Transform and Load Tools), usando herramientas como SQL e interfaces visuales de jalar y soltar.

El Data Integrator for Big Data amplía el producto ODI de Oracle para manejar fuentes de big data.

ODI proporciona a las organizaciones la capacidad de juntar datos provenientes de varias fuentes y formatos, como los datos relacionales alojados en IBM o las bases de datos de Microsoft, y el material que reside en data warehouses de Teradata. Por ello era un paso natural conectar los repositorios de big data con ODI.

Con la extensión, "uno no tiene que volver a capacitar a un administrador de base de datos en Hive para Hadoop. Ahora podemos darle un toolkit con el que estarán familiarizados, sostuvo Pollock. El administrador puede trabajar con conceptos familiares como entidades y relaciones, y el mapeo de flujo de datos 4GL. El software "automáticamente genera el código en los diferentes lenguajes que se necesitan para completar el trabajo, indicó el ejecutivo.

El software puede funcionar con cualquier despliegue Hadoop o Spark, y no requiere de instalación de software en ninguno de los nodos de datos. Mediante el uso del poder de la computación distribuida, el Data Integrator for Big Data utiliza los nodos en donde los datos se encuentran almacenados para llevar a cabo todos los cómputos que se necesitan.

Una organización de retail podría usar el software para analizar el historial de compras de sus clientes. Los sistemas de captura de datos en tiempo real como Oracle GoldenGate 12c podrían mover los datos transaccionales a un cluster de Hadoop, en donde se pueden preparar para el análisis mediante ODI.

Oracle no es la única en intentar utilizar las nuevas herramientas de big data con el tradicional software de análisis de datos. La semana pasada, HP lanzó un paquete de software que permite a los clientes integrar la base de datos de análisis Vertica con la plataforma IDOL (Intelligent Data Operating Layer) de Autonomy, proporcionando una forma para que las organizaciones analicen rápidamente grandes cantidades de datos no estructurados.