Llegamos a ustedes gracias a:



Noticias

Los requerimientos de analítica de datos empujan a la tecnología de bases de datos al límite

[19/11/2010] Las nuevas necesidades de analítica de negocios están exponiendo las limitaciones de las tradicionales tecnologías de administración de bases de datos e impulsando el crecimiento de plataformas de analítica altamente especializadas, de acuerdo a un reporte de dos analistas líderes de la industria.

Los nuevos productos se encuentran diseñados para analizar grandes y diversos conjuntos de datos en forma más eficiente de lo que se puede hacer con los tradicionales productos de bases de datos. E integran nuevas tecnologías de administración de bases de datos y almacenamiento para lograr capacidades de administración y recuperación de datos más eficientes, señala el reporte.
El documento, preparado por Beye Network de Merv Adrian, director de IT Market Strategy; y Colin White, presidente de DataBase Associates Inc. y fundador de BI Research, fue auspiciado por ocho proveedores de las nuevas tecnologías. Incorpora retroalimentación de 168 empresas que en la actualidad no están usando las nuevas tecnologías.
En los últimos años, la noción de que un motor especializado para analítica es una buena idea ha logrado una significativa aceptación comercial, indicó Adrian. Las personas están comprando alternativas a sus sistemas de administración de bases de datos para manejar las nuevas y cada vez más complejas necesidades de análisis de negocios en tiempo real, señaló.
Muchos de los nuevos productos provienen de proveedores relativamente nuevos y pequeños como Netezza, Vertica, Aster Data, Greenplum y ParAccel. El mercado total para los productos de estos proveedores es aun relativamente pequeño, de alrededor de 500 millones de dólares. A pesar de ello, el creciente interés corporativo en sistemas analíticos especializados de administración de bases de datos (specialized analytic database management systems - ADBMS) ha forzado a los grandes proveedores a tomar nota.
En setiembre, IBM anunció sus planes para adquirir Netezza, una de las pioneras en esta área, por 1,7 mil millones de dólares. Un mes antes, Teradata, proveedor de appliances de data warehouse de gama alta, adquirió Kickfire, una nueva compañía fabricante de tecnologías especializadas de analítica. Y en julio, EMC acordó comprar Greenplum, empresa desarrolladores de software de data warehousing de gama alta.
Mucha de la actividad está siendo impulsada por el creciente interés corporativo en el análisis de datos estructurados en los data warehouses empresariales, así como de datos no estructurados fuera de los warehouses, señaló Adrian. Cada vez más, las compañías buscan desarrollar analíticas complejas en tiempo real sobre datos de texto no estructurados, weblogs¸ feeds científicos, fotografías, videos y archivos de sonido.
La encuesta Beye mostró que casi el 45% de los encuestados se encuentran actualmente alimentando sus plataformas de analítica con datos XML, 24% con archivos de datos no estructurados y más del 23% que están analizando datos de weblogs. Los sistemas tradicionales de administración de bases de datos, productos de analítica y mecanismos de almacenamiento simplemente no se encuentran diseñados para estas nuevas formas de datos y no se encuentran bien equipados para trabajar con ellos, sostuvo.
La tecnología fue diseñada para procesar grupos de transacciones. Ese diseño es diferente del diseño que dice que lo quiero hacer es analizar muchos datos y hacerlo en tiempo real, manifestó.
La tendencia es desafiar los enfoques de analítica de datos tradicionales en los que el análisis generalmente es desarrollado fuera de la base de datos en software rich client sobre desktops, señaló Adrian.
Cada vez es más usual que se requiera de un sistema de administración de base de datos para también ayudar en la analítica. Es evidente que para muchas aplicaciones uno quiere mover el análisis a los datos, indicó. Ese requerimiento está impulsando a muchos proveedores, incluyendo a los posicionados como IBM, Microsoft, Oracle, SAS y otros, a soportar analítica in-database y capacidades in-database mining.
Muchos de los nuevos sistemas especializados usan modernos paradigmas de almacenamiento para permitir una recuperación de los datos por columnas más eficiente, señaló el reporte Beye. También codifican datos para su mejor compresión y algunas veces usan nuevas tecnologías para realizar algo del trabajo básico de análisis a nivel del almacenamiento para liberar al procesador para el trabajo más pesado.
También conectan procesadores unos con otros y con el almacenamiento de datos en redes veloces para incrementar el procesamiento y el almacenamiento en sincronía, señala el reporte. Los clásicos productos RDBMS no fueron construidos con estas innovaciones en mente y no siempre es fácil actualizarlos para aprovechar estas nuevas oportunidades.
Jaikumar Vijayan, Computerworld (US)