Llegamos a ustedes gracias a:



Conversando con...

Paul Roma, chief analytics officer de Deloitte Consulting LLP

¿Su lago de datos se convirtió en un pantano de datos?

Paul Roma, chief analytics officer de Deloitte Consulting LLP.

[31/03/2017] Como analista líder de Deloitte, Paul Roma dirige la práctica de analítica de la compañía en todos los negocios, así que él observa cómo las compañías enfrentan una serie de problemas. El editor principal de Network World, John Dix, habló con Roma recientemente sobre temas que abarcan desde qué problemas de analítica enfrentan las compañías (Recordar: La referencia al pantano en la parte superior) hasta las herramientas que ayudan a obtener más valor (analítica cognitiva y aprendizaje de máquina), así como de los roles ejecutivos que están evolucionando (el título no importa mucho, pero la posesión del problema sí).

Cuando acuden a usted, ¿qué pretenden solucionar los clientes con mayor frecuencia? ¿Están buscando resolver un problema específico o intentan lidiar con los problemas analíticos en general?

Cuando acuden a nosotros, el problema que desean tratar con más frecuencia tiene que ver con el resultado de algún negocio específico. Un cliente podría estar buscando, por ejemplo, mejorar sus Net Promotion Scores (NPS), que son una norma de la industria para calificar la relación de un consumidor con una corporación particular y sus productos. Se llama Net Promotions porque es un método iterativo que añade muchos factores conjuntos hasta llegar a construir una forma de autoevaluación. O una organización de salud podría acudir a nosotros para que la ayudemos a mejorar los resultados en ciertos protocolos de salud, así que básicamente estamos hablando de resultados de negocio.

Cuando usted llega, ¿encuentra que las compañías cuentan con las herramientas analíticas que necesitan, o también buscan información sobre nueva tecnología?

Los clientes más grandes tienen las herramientas analíticas. No existe una compañía en la que nos introduzcamos que no tenga una herramienta para todo. La cuestión trata más con el uso particular. No se trata de escasez de datos tampoco, puesto que cuentan con toneladas de datos. Ahora es normal tener almacenes de datos o lagos de datos que se han ido armando a través de los años. Pero he visto varios millones de dólares empleados en los lagos de datos que se convierten en lo que yo llamo pantanos de datos. Las compañías han gastado todo este dinero para juntar todo, y aun así no pueden hacer nada con eso. La pregunta principal ahora es cómo utilizar los datos para obtener mejores resultados.

Dado que existen muchos datos y muchas herramientas disponibles para darles sentido, ¿cómo hace para ayudar a sus clientes a avanzar?

Les ofrezco tres maneras de pensar. Primero, si quiere un cierto resultado, esto le llevará a hacer ciertas preguntas sobre el problema. Si es que yo deseo mejorar las relaciones con el consumidor o si es que deseo mejorar los resultados en salud, al menos sé qué quiero hacer. Conforme uno analiza los datos, la experiencia le lleva a crear ciertos dominios y tomar lo que es un lago de datos muy poco estructurado para aplicar límites estructurados.

Una vez que haya hecho eso, puede empezar a utilizar herramientas más avanzadas, como la analítica cognitiva, para aplicar estructura a los lagos de datos, así como el procesamiento de lenguaje natural y el aprendizaje de máquina para tener una manera de permitir que los datos le den una hipótesis.

Las técnicas avanzadas han ido más allá de producir un reporte y después observar el gráfico para ver qué es lo que dice. Ahora el aprendizaje de máquina puede crear análisis causal y decirle cuáles son las hipótesis para las variables o los dominios de datos que tienen mayor influencia en algún resultado en particular. En salud, por ejemplo, la máquina puede indicar por qué las readmisiones son altas en un protocolo determinado. El análisis causal lleva a ese tipo de analítica.

Las técnicas avanzadas son probablemente el motivo principal por el que nos llaman en busca de ayuda para dar sentido a todos los datos. Sin las técnicas avanzadas no existe manera de atravesar la información. No cuenta con un cuchillo para cortar a través de los datos. Simplemente ejecutar reportes generará cantidades infinitas de papel que, francamente, nadie podrá interpretar.

Nosotros ofrecemos algoritmos afinados de forma personalizada a muchos de nuestros clientes -ya sea en la industria de salud, cadenas de abastecimiento o marketing de clientes- y con los algoritmos de aprendizaje de máquina, junto con los ciclos de aprendizaje supervisado, podemos evaluar sus datos y crear una hipótesis que puede investigar con su experiencia.

Interesante. ¿Esos algoritmos son de mercados verticales particulares o existe una base común desde la que empieza a construir?

Tenemos horizontales y verticales. Los verticales se sintonizan con los mercados como los de cadena de proveedores en fabricación o cadena de proveedores en productos de consumidor, protocolos en ciencias de la vida, etcétera, y los horizontales son utilizados a lo largo. [Un ejemplo de los horizontales] es un algoritmo de terminación de matriz dispersa que patentamos. Si el lago de datos que posee para cierto tipo de problema no llena todas las variables que necesita, éste genera algoritmos predictivos para llenarlas y crea hipótesis referentes a cuáles serían las tendencias. Acabamos de aplicarlo a un protocolo de diabetes con una compañía grande de salud y, con 93% de certeza, podemos predecir quién no está cumpliendo con su protocolo de diabetes sin tener a ninguno de los datos de cumplimiento en asociación.

¿Lo que significa que puede predecir quién no está haciendo lo que debería estar haciendo?

Correcto. No se han estado pesando, no han estado haciendo sus ejercicios. No pronostica exactamente qué es lo que no están haciendo porque acabamos de empezar, pero pronostica quién no está cumpliendo. Esperamos mejorar su precisión y llegar a los 90s superiores, y entonces podremos examinar un sistema hospitalario completo, porque se vuelve predictivo en ese punto. Antes de que tenga problemas de cumplimiento, puede mostrar puntajes con tendencias. Esta persona está generando tendencias dirigidas a alguien que no cumplirá. Después puede hacer que una enfermera llame y pregunte, "¿Está teniendo problemas para tomar su insulina? "¿No está viendo al doctor porque tiene un problema de transporte? Puede empezar a buscar problemas particulares en el protocolo para intentar ayudar.

¿Esto es algo que deja como un legado después de que su asignación termine?

Deloitte se ha convertido en proveedor de productos y software en los últimos cuatro años. Esa fue mi meta anterior, crear la parte de productos y soluciones de nuestra compañía así que puedo hablar bastante a fondo sobre ese tema. Ahora ofrecemos productos de software como servicio y dejamos atrás, por así decirlo, las soluciones instaladas. Hacemos ambas cosas. Es simplemente cuestión del problema que estamos resolviendo sobre cuál tiene más sentido y cuál tiene un costo menor.

¿De dónde viene el empuje para este tipo de análisis dentro de una organización?

Yo diría que el empuje más fuerte proviene del negocio, no de la sala de reuniones. Hacemos bastantes paneles de control para ejecutivos, pero típicamente se empieza con un propietario de negocio, y una vez que el análisis está funcionando, el propietario del negocio se lo presenta al CEO, así como al directorio, y se convierte en algo más viral, con frecuencia llegando a bajar hacia la siguiente unidad de negocio.

Yo estaba hablando con el chief data officer de una firma financiera y él me afirmó que, cuando empezaron parte de sus iniciativas de big data, tuvieron que reconciliar una serie de diferencias en sus datos centrales de clientes. ¿Eso es algo típico en muchas organizaciones?

Sí. El dominio de los datos parece ser un problema sin fin, para ser honesto. Las herramientas para dominar los datos han mejorado, pero la cantidad de datos creados está sobrepasando las capacidades de las herramientas. Es un problema muy común y es un problema crítico de recorrido. Se convierte en algo central para casi todos los problemas.

Hablando de los chief data officers, el título surgió primero en la esfera financiera, pero parece estar apareciendo en más industrias. ¿Está viendo la aparición de nuevos roles conforme el análisis obtiene una prioridad mayor?

Definitivamente. En ciertas organizaciones el chief marketing officer es el chief data officer. En otras organizaciones, el chief digital officer es quien es dueño de los datos. Una de las primeras cosas que intentamos entender es quién es el dueño de los datos y en qué nivel se encuentra la propiedad de éstos, cuál es nivel administrativo verdadero en el que son asignados los datos. Nosotros no incentivamos a que todos tengan un CDO necesariamente. Lo que incentivamos es un gobierno y posesión de los datos que sean adecuados para que puedan ser priorizados.

¿La mayoría de los clientes ya tiene asignada esa propiedad?

Mitad y mitad. Yo diría que, en la mitad de casos, las compañías se encuentran encaminadas, ellas tienen un mapa que dice que intentan mejorar la seguridad de sus datos de determinadas maneras, estamos intentando mejorar nuestros enfoques de análisis avanzado de tales maneras, y pueden hablar sobre cómo intentan mejorar su manejo de consumidores y dominio de datos, por ejemplo.

La otra mitad no tiene mapas para todos los dominios, y en esos casos usualmente recomendamos juntar a muchos de estos programas para poder reforzar las iniciativas que tienen el fin de crear mejores resultados de negocio para todo, desde la cadena de proveedores hasta marketing, fabricación, finanzas, etcétera. Juntar a los programas y alinearlos usualmente resulta ser mucho más económico.

Cambiando un poco de tema, ¿estas nuevas iniciativas de la Internet de las cosas generan otro problema de big data? ¿Qué está observando?

Ahora trabajamos bastante con IoT, y la demanda está aumentando rápidamente. En términos de que esto represente un problema, usualmente participamos en lo que respecta a la estrategia de un resultado en particular, porque los programas de la Internet de las cosas generalmente son costosos y abarcan varios años, y hemos visto algunos de ellos operar descontroladamente con bastante rapidez. En los últimos tres a cinco años, hemos visto compañías que incursionaron en este campo y no consiguieron la recompensa que buscaban. Ahora la tecnología es superior y mucho más barata. Desde nuestra perspectiva, nosotros diríamos que se encuentra disponible ahora, dependiendo del caso de uso, y estamos viendo eso en la demanda, en las implementaciones y en el retorno sobre la inversión.

¿Existen otros aspectos generales que pueda haber dejado de lado y que sean importantes mencionar?

Una tendencia de la cual no hemos hablado es la cognitiva. ¿Cómo se construyen sistemas intuitivos con los que uno pueda interactuar, que empiecen a pensar como nosotros y que empiecen a entender palabras habladas, imágenes y fotos?

Google pronostica que en los próximos tres años, más del 50% de las búsquedas van a realizarse en forma de audios, imágenes y video. Digamos que se equivoquen por un año. Digamos que son cuatro años. El cambio sigue siendo inmenso y se impregnará en nuestros procesos y en nuestras aplicaciones.

La habilidad que tienen nuestros sistemas empresariales para interpretar la palabra hablada, los datos sin estructura, e interactuar con nosotros de aquellas maneras, se está introduciendo rápidamente dentro de la trayectoria crítica. Tenemos muchos proyectos que están trabajando en esto. Es una enorme área de inversión en muchas industrias.

¿Alguna en particular?

La número uno es salud, seguida de servicios financieros. Pero todas las industrias están interesadas, incluyendo la industria de hospedajes y ocio debido a los aspectos de interacción del consumidor. La industria hotelera ha sido una gran usuaria de productos para el consumidor, debido a las oportunidades de interacción con el consumidor. Yo diría que mientras más activo es, en términos de interacción, mayor será la ayuda que obtenga con estas tecnologías.

¿Cuál podría ser un ejemplo para la industria de salud?

Un muy buen ejemplo, debido a que hemos empleado algunos de ellos, es utilizar tecnología cognitiva para construir un caso real, tomando registros médicos electrónicos, la historia de recetas farmacéuticas, la historia familiar, las evaluaciones de riesgos de salud, y recopilar todo esto para que lo tenga el doctor antes de la visita, y de hecho señalarle, "Usted necesita observar esta porción del diferencial de sangre (que es básicamente un análisis de sangre) porque las lipoproteínas de baja densidad están fuera del rango y las células grandes son las que están en problemas, y empezar realmente a analizar y aconsejar.

Después el doctor puede responder con una pregunta como: "¿Puede recomendarme un medicamento? Y respondería con un consejo - "Yo recomendaría este medicamento, y no utilizaría este porque está contraindicado debido a una historia familiar de reacción alérgica de tipo X.

La máquina le puede dar ese consejo en un diálogo en tiempo real. La máquina construye una cadena cognitiva y le permite recorrer varias conversaciones y aprende cómo seguir al doctor y descifrar qué es lo que van a preguntar. La primera vez que el doctor la use no va a saber mostrar las recetas farmacéuticas y hacer esa recomendación. Pero cuando el doctor pregunta siempre, la maquina va a ir añadiendo la información a lo primero que le haya dicho al doctor y así continuará haciéndolo. El sistema empieza a volverse más inteligente sin que nadie escriba software. Usted lo entrena en vez de construirlo. Francamente, esa tendencia es un cambio significativo en términos de cómo interactuamos, pero también es un cambio en la manera en la que construimos los sistemas y cómo pensamos en sus usos.

Fascinante. Suena a que tiene un trabajo divertido.

Divertido o desgastante. ¿Quizás ambos?A mí me encanta.