Llegamos a ustedes gracias a:



Conversando con...

Stephen Brobst, chief technology officer de Teradata

Los grandes datos

[26/09/2011] Últimamente ya no se habla solo de datos, sino también de grandes datos. Éstos son aquellos que generalmente caen dentro de la categoría de los datos no estructurados y que, por ello, son una categoría que apenas y comienza a ser aprovechada por las compañías que los generan.
Stephen Brobst, Chief Technology Officer (CTO) de Teradata, estuvo recientemente en Lima y conversó con CIO Perú sobre lo que implican estos grandes datos en el día a día de las empresas. Junto con él, Matías Gil, country manager para Chile & Perú de Teradata, nos proporcionó la visión local de la firma y sus planes de expansión.
¿Las herramientas que teníamos para analizar los datos sirven para los grandes datos?
Brobst: Creo que necesitamos nuevas herramientas en dos áreas específicas. Primero, para analizar los grandes datos y tener el insight de ellos, las herramientas de visualización son muy importantes.
Matías Gil, country manager para Chile & Perú; y Stephen Brobst, Chief Technology Officer (CTO) de Teradata.
El segundo punto es que el lenguaje SQL, que es el lenguaje tradicional para las bases de datos relacionales, no es el mejor lenguaje para los datos no estructurados y algunos de los datos estructurados.
Entonces, se tiene que utilizar otra herramientas que es el nuevo modelo de programación desarrollado por Google llamado MapReduce. Google tiene una implementación de este modelo, pero también hay implementaciones de código abierto que pueden ser utilizadas por todos. Particularmente, en Teradata hemos adquirido hace unos meses un spin off de la Universidad de Stanford y un spin off llamado AstorData, que han implementado una versión de MapReduce para datawarehousing. Este modelo es importante para los datos no estructurados y algunos de los estructurados.
Entonces ¿se está incrementado el uso del datawarehousing en la región?
Sí, vemos un incremento del uso en la región porque lo que está pasando es que en los años pasados muchas empresas se han enfocado en renovar sus sistemas transaccionales principales.
Y ya que estos sistemas se encuentran implementados y funcionando, ahora quieren extraer inteligencia de esos datos y por tanto el datawarehousing está experimentando un auge. Debido a ello hemos incrementado significativamente nuestros ingresos en América Latina e incrementarlos más este año. De hecho, los ingresos en América Latina están creciendo más rápido que los ingresos de Estados Unidos.
¿Recopilar más datos implica que tiene que crecer la infraestructura de almacenamiento?
A medida que crecen los datos, se tiene que tener más almacenamiento; pero también hemos invertido en tecnología de compresión avanzada. En el release más reciente de Teradata, el 13.10, que fue lanzado hace unos nueve meses, presentamos la compresión avanzada, y en el que lanzaremos a finales de año -la versión 14- incorporaremos la compresión extrema.
Nosotros tenemos clientes que ya lo están usando en beta y obtienen más de 97% de compresión, aunque esto depende de los datos. Sin embargo, podemos decir que en los datos de registros detallados y en los datos de clic-stream, que tienden a ser los grandes datos, sí que es importante comprimir bastante los datos. En general, para los datos de registros detallados y de weblog se tienen una compresión por encima del 95%.
Esto es importante porque en el 2011 vamos a crear el 50% de todos los datos creados en últimos 40 años de la historia. Y no vamos a fabricar tanto almacenamiento como datos, lo cual significa que tenemos que usar la compresión para poder analizar esos datos.
Además, se debe de tomar en cuenta que las fuentes principales de esos datos van a ser los datos de los sensores y del social media.
¿Cómo se pueden aprovechar entonces estos datos?
Las empresas comerciales, por ejemplo, han tenido por mucho tiempo formas de rastrear la localización de sus camiones de reparto, paquetes y productos. Ahora comenzaremos a ver sensores en vehículos de consumidor. Estamos comenzando a verlo en Europa y Estados Unidos, donde las empresas de seguros los usan para rastrear vehículos robados.
Pero además, los datos recolectados pueden crear nuevos productos. Si vendes seguros para automóviles, puedes tener otros productos en base a los hábitos de manejo de las personas monitoreados por los sensores. Esto está comenzando a surgir en Estados Unidos y Europa y es solo cuestión de tiempo para que llegue a América Latina.
¿Cómo enfrenta Teradata estas necesidades de mercado?
En los viejos tiempos de Teradata, nos concentramos en las grandes compañías. Fuimos parte de NCR Corporation hasta el 2007, pero luego nos separamos y desarrollamos una familia de productos para atender a una amplia gama de empresas, así que atendíamos a las empresas top en diferentes industrias en los países en los que operábamos.
Ahora vamos por el siguiente nivel de empresas, las medianas, pero no de las empresas pequeñas, ya que tienes que tener un cierto nivel de masa crítica para poder beneficiarte de los datos, tienes que tener sistemas ERP, y sistemas similares.
¿A nivel local cuál es el desarrollo que se ha tenido?
Gil: En América Latina y en Perú lo que se está viendo es que la proyección económica es la más alta de la región, y por ello hay más propensión de las empresas a buscar ventajas competitivas y tener herramientas para capitalizar todo el crecimiento que se está dando en el mercado.
Las empresas peruanas tienen un grado de madurez relativamente alto en sus sistemas transaccionales. Con eso me refiero a que las principales compañías, es decir, las principales telcos, los principales retailers, e industriales, ya tienen resueltos sus temas transaccionales -ya tienen un ERP, por ejemplo- y tienen un sistema de producción integrado con otros sistemas.
Cuando eso sucede, dada toda la información transaccional que la empresa genera, es necesario que toda ella se consolide en un único lugar bajo un modelo de negocio coherente, de tal modo que a partir de ahí se pueda extraer inteligencia para poder tomar decisiones que proporcione esa ventaja competitiva.
En ese sentido, vemos a Perú en buena situación en cuanto a crecimiento de mercado, y de madurez de mercado, lo cual propicia que se adopte este tipo de soluciones.
Específicamente hablando de Teradata, la operación de Perú se maneja desde Chile, pero dada esta buena proyección tenemos planes de abrir una oficina en Perú. Hoy tenemos dos grandes clientes que son nuestra ancla y a partir de esa masa crítica estamos en condición de poder expandir esta plataforma de soluciones por lo menos a las principales 15 empresas del Perú.
Hoy nos encontramos sirviendo al BCP y a Movistar que son las líderes en sus industrias, y hay otras 15 compañías muy grandes que calzan con nuestro modelo y a las cuales podemos entregar mucho valor con esta plataforma.
Por ello nuestro foco se encuentra en esas 15 principales compañías que se encuentran en las industrias de retail, telco, servicios financieros, mineras, consumo masivo y producción. Estamos en un proceso fuerte de adquisición de nuevos clientes.
Jose Antonio Trujillo, CIO Perú