Llegamos a ustedes gracias a:



Columnas de opinión

Cuatro preguntas a responder antes de empezar una iniciativa de Big Data

Por: Reda Chouffani, vicepresidente de Biz Technology Solutions

[06/09/2012] A través de muchas encuestas, los ejecutivos han identificado que las iniciativas de big data se sitúan en los primeros puestos en las listas de proyectos para el 2012 y 2013. No es de sorprender, ya que la promesa de que los grandes volúmenes de datos pueden mejorar y agilizar las presentaciones, descubrir los hábitos de compra de los consumidores y, en la industria de la salud, incluso ayudar a salvar vidas, es simplemente demasiado importante como para pasarla por alto.
Sin embargo, deben ser respondidas varias preguntas clave:
* ¿Qué datos debe considerar?
* ¿Cómo se capturan los datos?
* ¿Qué beneficios tangibles pueden proporcionar las iniciativas de big data para mi organización?
* ¿Cuál es el ROI de una iniciativa de big data?
Si bien puede haber más dudas en la mente de muchos ejecutivos de TI, éstas son las cuatro que dominan la mayoría de las conversaciones. Aquí están los detalles y respuestas a las preguntas anteriores.
¿Qué datos debe considerar?
Los datos se presentan en tres formatos -estructurados, semi estructurados y no estructurados. Los datos estructurados se organizan de tal manera que tanto las computadoras como los seres humanos los pueden leer. El ejemplo más obvio es una base de datos relacional. Los datos semi estructurados, que incluye el intercambio de datos electrónicos, XML, y de correo electrónico (EDI), carece de tal estructura formal, pero contiene las etiquetas que separan los elementos semánticos. Finalmente, los datos no estructurados se refieren a los tipos de datos, incluyendo imágenes, audio y video, que no son parte de una base de datos.
El desafío más importante es la necesidad de desbloquear los datos y tener acceso a ellos para poderlos almacenar y utilizar. Esto permite que la información permanezca en su formato crudo, donde puede ser analizada y revisada, al tiempo que se transmite tiempo real a un sistema de análisis. Para los datos estructurados, este proceso es bastante sencillo. Cuando se trabaja con los datos no estructurados, por otro lado, son necesarios algoritmos avanzados y potentes motores para procesar los datos entrantes.
¿Cómo se capturan los datos?
Hay un sinnúmero de fuentes de datos disponibles para usted, pero ellas también proporcionan innumerables tipos de datos. En última instancia, todo se reduce a la combinación de los datos que necesitan ser recogidos.
Una de las fuentes de datos más comúnmente discutidas que utilizan las empresas de hoy para comprender mejor a sus consumidores y hacer un seguimiento de la marca, son los medios sociales. Esto es posible debido a que Facebook, Twitter y otras importantes redes sociales ofrecen algún tipo de acceso a datos mediante una interfase de programación de aplicaciones (API).
La siguiente fuente de datos importante se refiere a los patrones de localización y movimiento. A medida que RFID, la tecnología inalámbrica e infrarroja se hace más pequeña y más asequible, las empresas tendrán más activos, empleados y clientes, informando sobre su ubicación a la aplicación empresarial adecuada.
Así como las organizaciones capturan datos de estas fuentes y las combinan con los datos estructurados y no estructurados que se almacenan en las instalaciones y en la nube, deben asegurarse de que están siendo utilizados de una manera que valga la pena.
¿Qué beneficios tangibles para mi organización pueden proporcionar las iniciativas de big data?
En la mayoría de las verticales del mercado actual, la información que se necesita para una iniciativa de grandes datos ya está disponible; sin embargo, es posible que en algunos casos le falte volumen y normalización. Muchas organizaciones se enfrentan al reto de implementar rápidamente la plataforma adecuada para capturar y extraer los datos de los diferentes silos de aplicaciones de negocio y que estén disponibles para el análisis de datos.
Las empresas de marketing y departamentos de marketing de hoy en día enfrentan el desafío de aprovechar los datos para generar, primero, más clientes potenciales y luego medir la eficacia de las campañas de marketing con precisión. Con muchos consumidores que discuten sobre las diferentes marcas en los sitios de medios sociales, tratar de rastrear tweets, comentarios de usuarios, y Me gusta a través de la web puede ser una tarea tediosa. Sin embargo, con tantos sitios sociales que ofrecen la posibilidad de extraer datos, las organizaciones pueden aprovechar los grandes volúmenes de datos para obtener información de los clientes y el análisis en tiempo real.
Cómo hacer big data de marketing: Respete la privacidad del consumidor o se puede quemar
Existen numerosas fuentes de datos en línea que los minoristas pueden usar. Gran parte de esta información tiene que ver con el comportamiento de navegación del consumidor y sus sentimientos generales por la marca. Como se señaló anteriormente, los datos pueden ser extraídos utilizando las API de servicios de medios sociales, así como los de Google y de los registros del servidor web. Además, muchos minoristas capturan datos dentro de sus tiendas, ya sea mediante el seguimiento de los carritos de compras físicos o el uso de tarjetas de recompensas para monitorear los patrones de compra de los clientes.
Los servicios de salud pueden utilizar los datos almacenados en los sistemas electrónicos de historiales médicos. Además, los recientes incentivos federales en Estados Unidos tales como la ley de estímulo, la Ley HITECH y la reforma de salud proporcionan incentivos financieros para la adopción de tecnología de información en salud, lo que hace que más datos estructurados y semi-estructurados estén a disposición de los médicos, las partes interesadas y otros ejecutivos. Por último, los dispositivos médicos portátiles y aplicaciones móviles de salud están ganando popularidad. Tanto los dispositivos como las aplicaciones generan un flujo continuo de datos, que las organizaciones de salud se están preparando para capturar y usar en nombre de la mejora de la atención al paciente.
Los avances en la investigación médica han permitido que los fabricantes de medicamentos elaboren pruebas farmacéuticas en pacientes con marcadores genéticos específicos. Esto se ha acelerado con la enorme magnitud de datos que los científicos pueden utilizar, junto con los datos más comunes a través de esfuerzos internacionales, como el proyecto Annotated Human Genome Data Project http://aws.amazon.com/datasets/2315?_encoding=UTF8&jiveRedirect=1.
Para la industria de la logística global, que se ocupa de la gestión de la cadena de suministro y control de las mercancías, los grandes volúmenes de datos procedentes de numerosas fuentes -tecnología GPS, mensajes EDI de proveedores y vendedores de envío, pallets y cajas de mercancías, dispositivos móviles con datos de clientes, sistemas internos de ERP y medios sociales- pueden proporcionar mucho conocimiento y apoyo al proceso de re-ingeniería.
Las empresas de financiación para empresas, como Citigroup, han iniciado el camino hacia una iniciativa de big data. El punto focal aquí es reducir el fraude y asegurar que los patrones normalmente ocultos en los conjuntos de datos puedan ser llevados a la superficie, exponer actividad como el lavado de dinero y asegurar el cumplimiento de las normas bancarias de EE.UU y las internacionales.
Por supuesto, muchas industrias -además de las señaladas aquí- pueden disfrutar de los grandes volúmenes de datos para ayudar a impulsar el cambio y la mejora.
¿Se puede medir fácilmente el ROI de las iniciativas de big data?
Mientras que algunos vendedores aseguran obtener ROI inmediato en big data, tendrá que identificar los diferentes aspectos de los datos a los que tienen acceso y cuál es el valor que le proporcionarán a su organización.
En la mayoría de los escenarios de retorno de la inversión, debe atar un análisis de costo-beneficio para el proyecto propuesto. En el caso de una iniciativa de big data, normalmente hay varios aspectos no medibles. Puesto que está buscando en grandes volúmenes de datos con la intención de descubrir ideas sobre posibles cambios en los procesos de negocio, es difícil predecir el valor de lo que puede descubrir.
Dicho esto, hay un par de reglas de oro a tener en cuenta.
Es poco probable que aumente el costo de una iniciativa de big data a medida que aumente el volumen de datos, ya que las tecnologías de los grandes volúmenes de datos tienden a ser altamente escalables. Además, aunque los datos se presentan en diferentes formatos (estructurados, semi-estructurados y no estructurados) en tasas de crecimiento cada vez mayores, la implementación y el mantenimiento de las plataformas que soportan Hadoop, puede ayudar a hacer que sea mucho más rentable que los sistemas tradicionales de gestión de bases de datos. Eso es porque las nuevas soluciones pueden ejecutarse en hardware que corre software de código abierto.
Como con cualquier nueva tendencia, la alharaca rodea a big data. En el pasado, muchas organizaciones utilizaban almacenes de datos de gran tamaño para el análisis de datos y la toma de decisiones basadas en esta evidencia. Tal como lo conocemos hoy en día, los grandes volúmenes de datos aportan información adicional a la mezcla, como el comportamiento de los medios sociales, que antes no estaba disponible para los usuarios de un silo de almacén -y ahora esos datos pueden ser almacenados y gestionados en la nube por una fracción de lo que una vez costó. Para sacar el máximo provecho de los datos, es fundamental saber qué significa big data para su organización y qué desea que logre su próxima (o primera) iniciativa de big data.
Reda Chouffani, CIO.com
Reda Chouffani es vicepresidente de Biz Technology Solutions, empresa que ayuda a las empresas medianas y grandes para que desplieguen software ER y BI, así como infraestructura de TI.