Llegamos a ustedes gracias a:



Reportajes y análisis

Cómo Big Data trae el análisis predictivo a BI

[05/10/2012] Desde hace muchísimo tiempo, el mundo del análisis predictivo ha sido el reino exclusivo de estadísticos y científicos de datos en torres de marfil que se asientan lejos de la línea de toma de decisiones empresariales diarias. Big Data está a punto de cambiar eso.
A medida que más flujos de datos se colocan en línea y se integran en los programas existentes de BI, CRM, ERP y otros sistemas de misión crítica del negocio, la siempre difícil (y tan rentable) visión única del cliente puede finalmente entrar en foco. Aunque la mayoría de representantes de servicio al cliente y ventas de campo aún no han sentido el impacto, empresas como IBM y MicroStrategy están trabajando para hacerlo pronto.
Big Data lleva el análisis más allá de los escritorios
Imagine un mundo en el que una CSR sentada en su consola puede tomar una decisión independiente sobre si vale la pena mantener o actualizar a un cliente problemático. Imaginemos también que un vendedor de campo puede cambiar el estante de vinos de un minorista -sobre la marcha- según las preferencias que los asistentes al próximo festival de jazz han escrito en Facebook y Twitter.
Big Data es una herramienta comúnmente utilizada para llevar la cuenta de transacciones y realizar análisis de regresión, pero ahora está llevando sus capacidades hacia las manos de los directivos de nivel de línea, que luego pueden utilizar datos no transaccionales para tomar decisiones empresariales estratégicas a largo plazo sobre, por ejemplo, qué poner en los estantes de la tienda y cuándo ponerlos ahí.
Sin embargo, Big Data no va a suplantar a las herramientas tradicionales de BI, señala Rita Sallam, analista de BI de Gartner. En todo caso, Big Data hará que la BI sea más valiosa y útil para el negocio. "Siempre vamos a tener que mirar al pasado... y cuando tiene datos importantes, va a tener que hacerlo aún más. BI no desaparece. Se ve mejorada por Big Data".
¿De qué otra manera va a saber si lo que está viendo en las fases iniciales del descubrimiento se sostendrán en el tiempo? Por ejemplo, ¿realmente los bolsos rojos se venden mejor que los azules en el Medio Oeste? Un vistazo inicial a través de los datos puede sugerir eso -más bolsos rojos vendidos en el último trimestre, por lo tanto los bolsos rojos se venden mejor.
Pero esta es una correlación, no una causa. Si se mira más de cerca, utilizando datos históricos de transacciones recogidos de sus herramientas de BI, puede encontrar, por ejemplo, que en realidad es su última campaña de posicionamiento la que está dando sus frutos, ya que ahora los minoristas están exhibiendo más los bolsos rojos.
Es por eso que el director de tecnologías emergentes de IBM, David Barnes, en realidad es más proclive a referirse a la producción resultante de las tecnologías de Big Data, como Hadoop, map/reduce y R como "puntos de vista". No querrá tomar decisiones empresariales de misión crítica sobre la base del análisis de los sentimientos de una cuenta de Twitter, por ejemplo.
La revisión de los datos no estructurados en los medios sociales cosecha recompensas inmediatas
Sin embargo, hay valor en los medios sociales. ¿Qué pasa si aprende, como el comprador de un minorista, que a los fans de Justin Bieber les encanta la casaca que llevaba puesta en el concierto de la noche última, y alguien tuitea que la compró en una de sus tiendas? A continuación, podría tomar una decisión rápida para abastecerse de casacas solo en esa ciudad, ya que sabe que está a punto de convertirse en un tema muy caliente, aunque sea por un tiempo muy limitado.
Sin un paquete de análisis predictivo (PA) en busca de patrones de la tuitoesfera que correlacionen su marca con la ubicación geográfica y otros factores como el número de menciones, podría perder la oportunidad para mover mercancía.
"En el pasado, hubiéramos basado nuestras decisiones en los datos históricos y, para cuando lo hiciéramos, esa tendencia puede haber pasado ya", señala Barnes. "Así que eso es PA en esteroides, a toda velocidad".
La manera de lograr esto es un matrimonio de tecnologías de código abierto (a donde la mayoría de las plataformas de Big Data están llegando en estos días), la ley de Moore, hardware comercial, la nube y la capacidad de capturar y almacenar grandes volúmenes de datos no transaccionales que una vez fueron descartados porque nadie sabía qué hacer con ellos.
Los datos no estructurados, como el vídeo y el correo electrónico, a menudo citados como una fuerza impulsora detrás de Big Data, apenas juegan un papel en esto. Sin embargo, una purga en los posts de blogs y foros de usuarios, correlacionan esta información con datos geográficos, emparejándola con archivos sin formato de los datos estructurados existentes de los clientes, y atraen flujos de nuevas fuentes como el motor de MicroStrategy, Wisdom, que rastrea lo que están diciendo unos 14 millones de usuarios de Facebook sobre su marca, lo cual es una herramienta nueva y poderosa.
RK Paleru, director de marketing industrial del proveedor de BI, MicroStrategy, señala que han sucedido dos cosas con Big Data. "Usted es capaz de traer más variedad de datos procedentes de diferentes fuentes, pero también puede tomar todos esos datos y... micro-optimizarlos. Por ejemplo, ¿cómo puede transformar herramientas que se utilizan por comportamiento, como la iPad o los teléfonos inteligentes, al punto en el que se tienen que tomar estas decisiones empresariales tácticas?".
Acortar el "tiempo de respuesta" es clave para el análisis de Big Data
Una gran ventaja de este tipo de análisis es el acortamiento del "tiempo de respuesta" (TTA), según Paul Barth, fundador y socio gerente de New Vantage Partners, una boutique de gestión de la información y firma de análisis de consultoría. Las consultas, o modelos, que los científicos de datos se demoraban meses en responder sobre la cadena de producción y plazos de producción, ahora se pueden hacer -en algunos casos- en horas, y en grandes cantidades.
Esto se debe a que las tecnologías de Big Data permiten que la información se trabaje antes de ser optimizada, racionalizada y relacionada. Esto, junto con luna analítica avanzada, permite que los administradores del negocio formulen y respondan preguntas en ciclos muy cortos. (Todavía no es algo que se instale y funcione, así que los trabajadores de TI y los modeladores de datos tendrán que echar una mano).
"Ellos están utilizando Big Data para automatizar el aprendizaje de máquinas, darle una vuelta de tuerca a los procesos", señala Barth. Si lo hace, puede generar más de 20 mil modelos de datos para cada línea de productos, en cada mercado, en todo el mundo, permitiendo que los usuarios vean hasta 18 meses hacia adelante. "Ese es un gran cambio. La razón por la que puede hacer eso es porque la tecnología de Big Data puede automatizar muchos de los pasos de modelado y ejecutarlos de una manera inmediata".
No hace mucho tiempo, esto habría sido casi imposible. A los analistas estadísticos les tomaba semanas, o incluso meses,  construir un modelo único. Si vendía 100 productos, no podía ir más allá de mil modelos en su línea de productos, lo que significaba que la información que estos modelos regresaban no era tan precisa u oportuna, como la que proporcionan los grandes modelos de datos disponibles en la actualidad.
"Big Data tiene tanto que ver con los grandes análisis como con los grandes volúmenes de datos", señala Barth. "Esto es lo que adoran los científicos de datos. Pueden repetir y repetir y repetir mientras aprenden los datos y obtienen algunas ideas iniciales durante el descubrimiento".
Gigabits de I/O y la capacidad de trabajar con los datos en entornos limitados de análisis de negocios fuera de los entornos de producción, refuerzan estos ejercicios de pensamiento, en lo que Barth llama una especie de "análisis ágiles" para hacer preguntas y resolver problemas.
Los análisis de Big Data no están listos para el prime time
Si bien todo esto es prometedor y emocionante para los usuarios de negocios -si es que siquiera llegan a saberlo-, enganchar los análisis de Big Data a un motor de procesamiento con lenguaje natural y una interfase de preguntas y respuestas al estilo Siri aún está por verse. Aunque es poderosa, Hadoop sigue siendo a todas luces una herramienta "primitiva" para hacer frente a los conjuntos masivos de datos.
Piense con cuidado acerca de la utilidad de estas ideas. ¿100 millones de opiniones realmente valen más que 100 mil, se pregunta Barth -o incluso unas mil de una plantilla altamente cualificada e influyente?
"Hay muchas repeticiones por ahí", señala Barth, y "aún necesita a los analistas realmente inteligentes" si quiere que su análisis se haga bien. Afortunadamente, añade, Big Data le da "herramientas muy poderosas" para hacerlo.
Allen Bernard, CIO (EE.UU.)