Llegamos a ustedes gracias a:



Conversando con...

Stephen Brobst, chief technology officer de Teradata

Big data ya no es solo para los científicos de la computación

[13/11/2012] Hace unos días estuvo de paso por Lima Stephen Brobst, chief technology officer de Teradata, con quien ya habíamos conversado en setiembre del año pasado sobre los grandes datos. Esta nueva oportunidad nos valió para preguntarle al ejecutivo cuánto se había avanzado y si ya habíamos dejado atrás la fase de la evangelización.
Aún es necesaria más evangelización pero las empresas ya comienzan a ver a big data como algo más que la nueva tecnología que se debe comprender. Ahora buscan encontrar el valor en ella, algo que se encuentra más allá de los análisis de los datos de los medios sociales, como en un inicio se planteó y esperó de la tecnología.
Brobst nos aclaró estas dudas y algunas otras.
Stephen Brobst, chief technology officer de Teradata.
Esta no es la primera vez que visita el Perú ¿han cambiado las cosas desde su última visita en setiembre del 2011 en cuanto a los big data?
Las cosas han cambiado. La primera vez que hablamos todos se preguntaban qué era big data, no tenían mucha idea al respecto, sabían que tenían que estar en ella pero no estaban muy seguros de lo que implicaba, creo que las transiciones en los mercados van de ¿qué esto? a bueno, ¿cómo obtenemos valor de esto?. En la etapa de evaluación tienen que entender la tecnología y lo que implica, pero ahora se encuentran en la etapa de preguntarse ¿cómo obtengo valor de ella?
¿Se puede decir que ya hemos pasado la etapa del evangelismo?
Se puede decir eso, pero hay aún evangelismo que se está haciendo y las personas están recibiendo más educación al respecto. También creo que hace un año las personas que realmente se encontraban haciendo algo serio eran casi todas empresas punto com. Ahora estamos comenzando a ver bancos, telcos, otros negocios que comienzan a ver el valor.
Entonces ¿se mantiene el que los big data son para las grandes empresas?
Se necesita un cierto tamaño para usarlo, aunque hay casos en los que puedes usar modelos basados en nube en lugar de tener tu propia infraestructura, como es el caso de los negocios de tamaño medio que quieren tener acceso a este tipo de capacidades.
¿Se están cumpliendo las promesas iniciales del big data con respecto a lo que se puede lograr?
Creo que en muchas ocasiones las personas creen que big data es obtener valor de los medios sociales y creo que hay algo de cierto en esto, pero lo que observo es que en los negocios tradicionales lo que se persigue no es necesariamente medios sociales. Ahí se hace más analítica avanzada, con analítica de series de tiempo, cosas que no necesariamente tienen que ver con los medios sociales. Los bancos y las telcos son las más sofisticadas con el tipo de interacciones con las que están trabajando, ellos están logrando interacciones a través de todos los canales, no solo de los medios sociales, y por ello consiguen una visión más completa y por ello es que hay un mayor énfasis en la integración de datos de todos los canales en lugar de concentrarse en Twitter y otros canales sociales.
¿Se requieren de herramientas especiales para big data?
Creo que ahora más que antes, ya que a medida que nos movemos hacia un marco de adopción tecnológica, los primeros adoptadores tecnológicos son los científicos de la computación que se encuentran en las empresas punto com, pero para que la tecnología se difunda tiene que pasar hacia otros personajes que no son científicos de la computación y por tanto las herramientas que se encontraban en código abierto diseñadas para los científicos de la computación son demasiado técnicas.
Los que ahora son exitosos no son los que están usando Hadoop, como científicos de la computación que usan Hadoop para almacenar los datos, sino que los que están utilizando herramientas de visualización de datos y técnicas más ágiles que no requieren de programación para poder acceder a los datos y otras opciones que nos dan funcionalidades sin que tengamos que hacer un programa.
¿Se requiere cambiar la infraestructura que la empresa necesita?
Más que cambiarla, se requiere infraestructura adicional. Las herramientas de visualización de datos se han hecho muy importantes en el big data, pero también creo que podría llegar a la inteligencia de negocios tradicional. No creo que sea necesario tirar las bases de datos relacionales o SQL, como algunos sostienen, sino utilizar modelos de procesamiento no tradicionales.
Y en cuanto al almacenamiento ¿se va a incrementar mucho con el big data?
Con seguridad que sí, pero ese no es un cambio. Las empresas que realizan analítica sofisticada van a crecer en datos al menos un 50% cada 12 meses, algo que se esperaba. Pero lo que sí creo que va a cambiar es que el almacenamiento que se va a utilizar va a ser más económico.
En la típica dataware house usamos almacenamiento de clase empresarial, en Hadoop generalmente se usan un conjunto de discos, algo muy barato que se puede hacer al aprovechar el principio de ingeniería de Hadoop, que es que Hadoop asume que el hardware va a fallar y por tanto tiene tres copias de los datos suponiendo que no es posible que las tres copias fallen todas al mismo tiempo, así que es necesario almacenamiento barato para poder almacenar los datos en Hadoop, tener un sistema contra fallas y estar confiado en que no se van a perder los datos. Y el software automáticamente encuentra las fallas, lo cual es algo diferentes a la mayoría de las bases de datos relacionales que se encuentran en el mercado.
Y en esta ocasión ¿cuál es el objetivo de su visita?
Vinimos para realizar un taller con nuestros clientes y prospectos de clientes sobre el uso de la computación móvil junto con inteligencia de negocios. Entonces el tema del big data es mostrar su evolución de los datos de clickstream a los datos de medios sociales y ahora a los datos provenientes de los sensores. Entonces hemos conversado sobre esta evolución y la conversión de los dispositivos móviles y la inteligencia sobre el consumidor como algunos de los temas.
¿Cuál es el nivel de awareness aquí en el Perú?
He estado reunido con una audiencia seleccionada, pero en general diría que es alto, ya que se encuentran listos para más posibilidades y desean más detalles sobre como avanzar en el tema. Generalmente en las grandes organizaciones, pero también en las organizaciones gubernamentales.
¿Desea agregar algo?
Si, recientemente hemos lanzado un appliance que coexiste, el Aster Data. Es una especie de extensión de big data a SQL con Hadoop. Y usamos diferentes factores forma con la tecnología y tenemos un almacenamiento de muy bajo costo para los datos en Hadoop y con Aster podemos llegar a esos datos y hacerlos disponibles, y esto es posible gracias al desarrollo en la comunidad de código abierto.
Jose Antonio Trujillo, CIO Perú