Llegamos a ustedes gracias a:



Conversando con...

Jennifer Widom, Universidad de Stanford

El big data y la academia

Jennifer Widom, profesora de Ciencias de la Computación e Ingeniería Eléctrica de la Universidad de Stanford.

[21/03/2017] Estamos muy acostumbrados a hablar sobre big data con las empresas, y al hacerlo olvidamos que otras partes de la sociedad también se pueden beneficiar. Eso fue lo que recordamos al conversar con Jennifer Widom, profesora de Ciencias de la Computación e Ingeniería Eléctrica de la Universidad de Stanford, con quien nos reunimos brevemente en un momento, entre las múltiples actividades que vino a realizar en Lima.

Por una invitación de la Universidad de Ingeniería y Tecnología, pudimos conversar con la académica y obtener un punto de vista distinto del tema. Ella vino para compartir sus conocimientos en una serie de clases magistrales y talleres que se realizaron en la universidad. Durante uno de sus breaks hablamos sobre el tema.

¿Cuáles son las expectativas que la gente tenía sobre el big data y que el big data no ha podido cumplir, si es que hay alguna?

Las expectativas para el big data son, que al recolectar los datos y al analizarlos, podemos mejorar la educación, podemos mejorar la sociedad, podemos hacer un buen uso de la información para entender cosas, tomar decisiones y tener conocimientos profundos.

¿Y hay expectativas que no se han cumplido en la parte empresarial?

No diría eso, diría que hay promesas de que big data se utilizará cada vez más en el futuro, pero no diría que haya promesas que no se hayan cumplido. Las promesas están ahí y es una trayectoria larga.

Por el nombre parece que está solo en manos de las grandes organizaciones.

De ninguna manera. En primer lugar, puedes hacer big data con small data (datos pequeños). Y, en segundo lugar, al menos desde mi punto de vista, el big data puede hacer mucho por la sociedad y por la ciencia, y por la investigación, no solo por las compañías. Sé que las compañías se encuentran interesadas en lo que puede hacer.

Se hablaba que el big data estaba compuesto por datos provenientes de las redes sociales, luego se habló de los sensores de la Internet de las cosas, ¿cuáles son, entonces, los componentes del big data?

No del todo, los ejemplos que di en la clase nos muestran que se puede usar en las predicciones del clima, o en mapas del tráfico, o en recomendaciones de películas, o en temas médicos. Estos son los tipos de cosas en los que se puede usar, no pienso particularmente en los medios sociales.

La Internet de las cosas también va a generar datos, pero hay muchos más usos, aunque menos conocidos del big data.

¿Qué herramientas hay actualmente para hacer trabajos con big data?

Las herramientas que se usan en big data van desde los sistemas de gestión de bases de datos, algunas de las cuales han estado con nosotros por 40 años, hasta sistemas e infraestructura moderna como Hadoop o Spark; y también hay muchas herramientas para aplicaciones específicas, como las aplicaciones de inteligencia de negocio u otras específicas para mercados financieros. Entonces tenemos herramientas generales y herramientas específicas.

¿Son necesarias herramientas nuevas?

Creo que siempre van a haber herramientas nuevas, es un área de tecnología que avanza rápidamente.

¿Fuera del sector de negocios, quiénes son los grandes actores de big data?

Todos, toda la sociedad. En las universidades, son los investigadores los que están manejando estos datos; en el gobierno es el propio gobierno, y en los negocios son las propias empresas.

Los datos pueden estar en un servicio de nube, pero en general las personas manejan sus propios datos o usan un proveedor para ayudarles.

¿Cuál es el motivo de su presencia en la UTEC?

Para ofrecer un curso corto sobre big data. He estado durante tres días, ocho horas al día, enseñando a los estudiantes lo básico sobre big data. También he hecho un taller sobre Design Thinking, y en unos minutos tengo una mesa redonda con mujeres.

¿Desea agregar algo?

Un ejemplo que di en la clase fue qué pasaría si la información médica de todos estuviera disponible en una base de datos de forma anónima. De esta forma, si toda la historia de la salud humana se encuentre en una base de datos, cada vez que vayamos a ver a un doctor se podría entrar a ésta. Se puede usar el aprendizaje de máquina sobre los datos para realizar mejores diagnósticos médicos.