Llegamos a ustedes gracias a:



Reportajes y análisis

¿Así que quiere ser un científico de datos?

Aquí está el alcance de uno de los roles de más rápido crecimiento en TI.

[03/05/2013] Después de meses de un alto grado de desempleo y una economía aún tambaleante, cualquier buena noticia en el mercado de trabajo va a llamar la atención. Pero incluso eso no parece explicar por completo la atención en torno a una profesión muy in: científico de datos.
Según CNN, el científico de datos es uno de los mejores puestos de trabajo del 2012, y un artículo en la Harvard Business Review lo llamó el trabajo "más sexy" del siglo 21.
El encanto que rodea a esta función está en correlación directa con el interés del mercado en general por los grandes volúmenes de datos, o big data, y su análisis -herramientas de trabajo para los científicos de datos, que tienen la tarea de desenterrar correlaciones significativas en los volúmenes de datos siempre crecientes y convertirlas en ideas rentables de negocios.
Es más, a menudo hay una condición de unicornio imbuida en las personas que encajan en esta posición multifacética, que combina la informática, conceptos cuantitativos avanzados, dominio del conocimiento de negocios y habilidades de comunicación. Con la demanda por los científicos de datos superando la oferta, los salarios de estos trabajadores bordean las seis cifras, según Mateo Ripaldi, vicepresidente senior de Modis, una firma de personal.
Los reclutadores también están de acuerdo en que la posición del científico de datos es de rápido crecimiento, incluso si el número de ofertas de trabajo aún no es sorprendente. "Cuando empezamos a buscar información sobre esta posición hace dos años, solo habían ocho publicaciones, y ahora hay 42", señala Tom Silver, vicepresidente senior para América del Norte del sitio de búsqueda de trabajo Dice.com. "Cuarenta y dos de 83 mil puestos de trabajo no es mucho, pero sospecho que habrán más anuncios en el futuro".
Con toda la atención, es natural que las personas con alguna experiencia en datos y computación se pregunten, ¿quiénes son estas personas, yo podría ser uno? Hemos tratado de responder a algunas de las preguntas más básicas aquí.
¿Qué es un científico de datos?
La respuesta a esta aparentemente simple pregunta depende de a quién le pregunte. Una definición ampliamente aceptada proviene de Hilary Mason, directora científica de Bit.ly: alguien que puede obtener, depurar, explorar, modelar e interpretar los datos.
Neil Raden, CEO de Hired Brains, va un poco más allá, y categoriza a los científicos de datos en dos grupos.
* Tipo I - verdaderos científicos que investigan y crean algoritmos y métodos, publican artículos y participan activamente en las comunicaciones de su disciplina. Estas personas se encuentran con mayor frecuencia en la investigación, la academia y las organizaciones donde los nuevos métodos y algoritmos son el núcleo de la empresa (Google, Amazon, Wall Street), comenta Raden.
* Tipo 2 -el grupo mencionado con más frecuencia en el mercado de contratación de hoy- no son científicos, sino profesionales, explica Raden. Son expertos en estadística y modelado matemático, entienden y emplean métodos cuantitativos, así como modelos de diseño, prueba y despliegue.
Jacob Spoelstra, jefe global de investigación y desarrollo en Opera Solutions, también hace una distinción entre lo que muchas personas categorizan ampliamente como científicos de datos y el trabajo que él y otros hacen en Opera, proveedor de análisis predictivo como servicio.
Los "científicos de datos" de Opera -que encajarían mejor en la categoría 1 de Raden- trabajan a nivel de la máquina de aprendizaje, desarrollan modelos estadísticos y algoritmos de reconocimiento de patrones que encuentran y extraen inteligencia predictiva de los flujos de datos masivos. Ellos convierten estos hallazgos en acciones dirigidas que ayudan a mejorar el negocio, por ejemplo, reducir el fraude financiero o a detectar las hipotecas de riesgo. Empresas como Google emplean a cientos de este tipo de científico de datos, estima Spoelstra, y de los casi 700 empleados de Ópera, cerca de un tercio son especialistas en aprendizaje de máquinas.
Mientras tanto, Greta Roberts, CEO de Talent Analytics Corp., cree que el conocimiento actual sobre el trabajo del científico de datos en realidad abarca cuatro roles funcionales. Después de realizar una encuesta en la que le pidió a los científicos de datos los detalles de cuánto tiempo dedican a 11 funciones de análisis, surgieron cuatro grupos: los profesionales de preparación de datos (que pasan la mayor parte de su tiempo en la adquisición, preparación y análisis de datos); programadores (que programa y hacer algo de análisis), administradores (que se concentran en la gestión, la administración, la presentación, interpretación y diseño de datos), y generalistas (que hacen un poco de todo).
"Cuando empecé a escuchar todo el bullicio, pensé, 'Nadie se ajusta a esa definición -¿Cómo es posible?", señala Roberts. "Debido a que es una función nueva, creo que la gente está tirando todo allí. Y cuando es demasiado específico, se genera un vacío". Lo que muchas empresas ven como un científico de datos, agrega Roberts, son en realidad una variedad de funciones realizadas por un grupo. Y aunque todavía puede haber escasez de personal para llenar estos roles, señala, la situación está muy lejos de salir a cazar unicornios, ya que muchas personas poseen la aptitud natural para crecer en una o más de las funciones necesarias.
¿Cuáles son las habilidades y las credenciales necesarias?
Como Roberts indica, las listas detallando las competencias de los científicos de datos han proliferado en la web, y pueden ser desalentadoras. La mayoría especifica experiencia en matemáticas avanzadas, análisis estadístico (incluyendo herramientas como R, SAS y Stata), programación (incluyendo lenguajes como C, C + +, Python y Java), bases de datos SQL, plataformas como Hadoop y MapReduce, minería y modelado de datos, visualización de datos, creatividad, habilidades de comunicación y comprensión del negocio.
Y es cierto que los científicos de datos requieren habilidades y capacidades que son distintas de las anteriores generaciones de analistas de datos, de acuerdo con Raden. Por ejemplo, tienen que ser capaces de manejar la gran variedad de datos disponibles en la actualidad, y la matriz resultante de análisis que se pueda emplear, agrega.
Necesitan conocimientos de programación, así como una formación en métodos cuantitativos y una orientación en investigación y modelado. Y deben ser capaces de discernir lo que es y no es significativo cuando se trata de los datos, prosigue Raden. Los científicos de datos eficaces también necesitan tener suficiente dominio de conocimiento del negocio y la capacidad de comunicar temas complejos a quienes no tienen la experiencia en las herramientas y los métodos empleados, señala.
Lo que mueve a los científicos datos por delante de otros profesionales de la analítica, indica Ripaldi, es la capacidad de comunicar -con frecuencia a la alta gerencia- lo que los datos les dicen, así como la forma de actuar de acuerdo con los resultados. "Puede analizar todos los datos que desee, pero si no puede articular lo que le está diciendo, no es un científico de datos", afirma.
Después de todo, el objetivo es avanzar en la estrategia del negocio, es decir la reducción de la pérdida de clientes, apuntar a las ofertas en todos los canales y mitigar los riesgos financieros.
Por otra parte, Roberts ve el conflicto inherente a estos requisitos, señala. "¿Tienen que ser capaces de sentarse y ver los datos de varios días a la vez, y luego cambiar a ser presentadores atractivos? Eso son dos personas diferentes".
Opera -que, de nuevo, contrata a científicos de datos de la variedad de aprendizaje de máquinas- busca a gente con experiencia en un campo cuantitativo, aptitud para las matemáticas y conceptos estadísticos, capacidad para crear instancias de estos conceptos en los programas informáticos, confort con grandes volúmenes de datos y un interés en la solución de problemas empresariales reales.
"Nos sentimos cómodos con alguien que necesita aprender los algoritmos de aprendizaje de la máquina, si demuestran una afinidad por las habilidades de resolución de problemas y por las matemáticas", señala Joseph Milana, jefe global de Analytics. "Puede que no sean matemáticos aplicados o que no hayan construido una red neuronal, pero deben demostrar energía e interés para ser incluidos".
¿Qué antecedentes se prestan para convertirse en un científico de datos?
En Opera, los solicitantes de mayor éxito tienen mayores niveles de formación académica e incluso un doctorado. "Teniendo en cuenta los avances de la ciencia y de la máquina de aprendizaje de las nuevas técnicas que están surgiendo, los científicos tienen que tener una formación avanzada y conocer los nuevos pensamientos o ideas", señala Milana. Incluso en Dice.com, la mitad de las publicaciones sobre científico de datos especifican un doctorado, de acuerdo con Silver. "No es absolutamente necesario, pero es una ventaja importante", agrega.
Opera contrata a través de una variedad de disciplinas orientadas a los datos, incluyendo la informática, la ingeniería eléctrica, la estadística, la ingeniería mecánica y la física. Tal conocimiento interdisciplinario puede ser útil, señala Milana. Por ejemplo, ha visto fórmulas originarias de la hidrología aplicadas a las señales de comercio del mercado de valores.
Para el mayor grupo de científicos de datos, Raden cree que un doctorado no es necesario y que las personas que ahora trabajan en inteligencia de negocio y análisis cuantitativo, con un poco de exposición previa a las matemáticas avanzadas y a modelos estadísticos, podrían crecer en estas funciones en una empresa que ofrece asesoramiento y capacitación en áreas clave como el modelado predictivo y big data.
Roberts está de acuerdo en que el enfoque en las habilidades específicas y las credenciales académicas a veces puede ser un indicador de cómo piensan los candidatos potenciales. "Lo que están tratando de medir es, ¿Te gustaría aprender? pero hay muchas maneras de hacerlo", señala. En la encuesta de Talent Analytics, las características innatas de los científicos de datos incluyen la curiosidad, la creatividad, la objetividad, pensamiento estructurado y atención al detalle, indica. Milana y Spoelstra concuerdan en que los rasgos naturales más importantes que buscan en los candidatos son la curiosidad, el pensamiento lógico, el sentido común, la perseverancia, el sentido práctico y el buen juicio.
No hay duda de que la necesidad de los científicos de datos solo va a aumentar. Pero debido a que el papel es relativamente nuevo, solo verá más cambios en el tiempo, tanto en términos de lo que estos profesionales hacen, así en cómo las empresas organizan, alcanzan y desarrollan el talento necesario.
"Esta es una gran oportunidad para la gente de TI, gestión de proyectos y gestión de productos que no tienen miedo de aprender por sí mismos y quemarse las pestañas para resolver las cosas", señala Roberts.
María Brandel, Network World (EE.UU.)