Llegamos a ustedes gracias a:



Reportajes y análisis

Científico de datos, un rol en auge

[18/06/2012] ¿Quiere obtener el valor real de sus datos? Mejor contrate a un científico de datos, o dos.
En los últimos meses, las grandes empresas, empresas de dotación de personal y universidades han observado un creciente interés en una nueva clase de profesional de los datos -el científico de datos. Una curiosa mezcla de conocimientos de negocios, análisis e informática, este nuevo título está en marcha en diversos mercados verticales, como energía, comercio electrónico, sanidad y servicios financieros. Y si los expertos están en lo correcto, esto es solo el comienzo.
"Las empresas se están convirtiendo en centrales de datos y aplicaciones. Ellas necesitan personas que puedan venir a extraer y modelar entornos de grandes cantidades de datos", señala Laura Kelley, vicepresidente de la firma de consultoría y de personal TI, Modis.
Lo que diferencia a los científicos de datos de los otros trabajadores de datos, incluidos los analistas de datos, es su capacidad para crear una lógica detrás de los datos que conducen a las decisiones empresariales. "Los científicos de datos extraen los datos, formulan y aplican modelos de análisis cuantitativo de una manera proactiva", añade Kelley.
"En la actualidad hay trabajos disponibles para los científicos de datos -solo tienen que tener la combinación correcta de habilidades", señala.
¿Qué habilidades se necesitan para ser un científico de datos?
Conozca a Michael Rappa, director del Institute for Advance Analitics de la North Carolina State University en Raleigh. Durante los últimos seis años, Rappa y sus compañeros profesores han estado refinando su programa de postgrado para educar científicos de datos. "Los científicos de datos tienen que dibujar datos estructurados y no estructurados de diferentes fuentes, incluyendo comunicaciones en tiempo real, y tratar de entenderlos para agregarle valor al negocio", señala Rappa. "No es solo sobre el volumen de los datos, sino la variedad y velocidad de los mismos".
Las compañías que tratan de manejar grandes volúmenes de datos con silos estadísticos, científicos de computación o MBA, van a fracasar, cree Rappa. En su lugar, se necesitan profesionales con la convergencia de estas habilidades para entender completamente el negocio y los desafíos tecnológicos.
Los MBA entienden los conceptos del negocio, tales como el desarrollo de productos y la gestión, pero no son capaces de analizar e interpretar los datos. Los matemáticos y estadísticos no tienen un conocimiento profundo del negocio. "Los científicos de datos deben tener una apertura para poder solucionar los problemas empresariales, no solo ser capaces de realizar algunos trabajos ingeniosos de modelado. Educamos a los alumnos de una manera que trasciende las disciplinas", anota Rappa.
Este enfoque ha sido aprobado con el 100% de los participantes que se colocan antes de la graduación. "Ellos son muy buscados y muy bien pagados", señala. De hecho, el programa ha ampliado recientemente su inscripción anual de 40 a 80. "Hemos duplicado el tamaño para satisfacer la demanda proveniente de los sectores público y privado".
Rappa admite que el término "científico de datos" es mucho más atractivo que sus partes de estadista y científico de la computación. "La ciencia de datos captura la imaginación", comenta.
Eric Horn, director de educación en el Data Sciences SUmmer Institute de la universidad de Illinois, está de acuerdo en que existe cierta mística en la ciencia de los datos, a pesar de que tiene una pesada influencia de las ciencias de la computación.
Por ejemplo, sus estudiantes, así como los que están en el Informatics Institute de la Univerasidad de Illinois, están capacitados en diversos algoritmos de aprendizaje automático, procesamiento natural del lenguaje y algoritmos inteligentes de búsqueda. También aprenden a cómo aplicar esos algoritmos en dominios muy numerosos como los servicios de salud. Al igual que Rappa, Horn ha sido testigo de un mayor interés en su programa, pero no se puede ampliar la matrícula en este momento debido al financiamiento.
Kelley de Modis siente que las oportunidades educativas se abren a medida que más empresas se centran en las habilidades de los científicos de datos. Ella anima a los candidatos con talento parciales -como los que tienen un MBA, sean analíticos o científicos de computación- para que llenen su currículum vitae con títulos o certificados de los programas a la medida como los de Rappa y Horn.
El proyecto de científico de datos
En el brazo de eBay, PayPal, el investigador principal, Mok Oh, está creando un equipo de científicos de datos de ensueño y tiene la esperanza de desenterrar candidatos como los que han sido batidos en los programas de las instituciones de Horn y Rappa.
PayPal planea estudiar las decenas de petabytes de datos que generan sus clientes y socios para predecir los patrones de compra. Oh quiere mezclar cuidadosamente los datos de gasto y comportamiento para desarrollar perfiles y descubrir tendencias que le ayudarán a atraer nuevos clientes a PayPal y su ecosistema de socios.
Aunque el candidato ideal de Oh debería tener los tres conjuntos de habilidades -de negocios, analíticas y científico informáticas- no ha encontrado a bastantes de ellos. "Es casi imposible encontrar esas tres cabezas en un solo cuerpo", coemnta. Así que en su lugar, está desarrollando un equipo de científicos de datos que abarque las tres disciplinas:
* La mayoría -80%- tendrán PHD enfocados en el aprendizaje de máquinas, procesamiento natural del lenguaje y minería de datos.
* 10% serán estadísticos altamente calificados en el modelado y análisis de datos y para el desarrollo de índices de rendimiento clave.
* Otro 10% tendrá MBA y sabrán las preguntas adecuadas, tales como "¿Por qué la gente dejó de usar PayPal?"
Oh, está convencido de que este equipo concentrado -frente a los silos dispersos de los analistas de datos- impulsará a PayPal hacia la nueva generación y para que sirva mejor a sus clientes.
Donald Farmer, vicepresidente de gestión de productos de inteligencia de negocio del fabricante de software QlikView, señala que la mayoría de las empresas pueden hacer uso de datos científicos para mejorar los procesos e identificar nuevas oportunidades de negocio. Por ejemplo, en los servicios financieros, los científicos de datos pueden desarrollar algoritmos para el comercio y la gestión de riesgos, y en productos farmacéuticos pueden estudiar los resultados de las pruebas de drogas.
Farmer advierte, sin embargo, que las empresas que adoptan a los científicos de datos tienen que estar preparados para tolerar el fracaso. "La ciencia de datos tiene que ver con los experimentos. Las empresas tienen que crear estructuras al borde de su organización que no solo se espera que fallen, sino que están predeterminadas a ello. En caso contrario, los científicos de datos no se esfuerzan lo suficiente", advierte.
Es una píldora difícil de tragar para las organizaciones con problemas de liquidez. "A veces tienes que fallar en un modelo para ser capaz de replantearlo correctamente -pero que puede ser riesgoso y costoso", señala Ryan Swanstrom, autor de la "101 Datos de la Ciencia", un blog sobre su viaje para convertirse en un científico de datos.
Teniendo en cuenta el entorno adecuado, los científicos de datos tienen el potencial para hacer que las empresas ganen oro, especialmente las dedicadas, al igual que en PayPal, a encontrar nuevos clientes y mejorar el servicio que se les da a los clientes existentes. Curiosamente, Swanstrom siente que al sacudir la trifecta de la ciencia computacional, los negocios y las aplicaciones analíticas con los campos periféricos, tales como la física y la psicología, podrían mejorar los resultados.
Kelley de Modis califica al rol del científico de los datos como "un trabajo en progreso". "Lo que las empresas llamaban científico de datos de hace un año es diferente a lo que necesitan hoy", señala.
Sandra Gittlen, Network World (EE.UU).