Llegamos a ustedes gracias a:



Reportajes y análisis

Intel quiere su nombre junto al Big Data

[12/08/2013] Durante el pasado evento Re imaginando el centro de datos, realizado en la ciudad de San Francisco, Intel no solo ofreció su perspectiva sobre el centro de datos; también se dio tiempo para ofrecer su visión sobre el big data y los avances que está realizando dentro de este campo.
De hecho, Intel tiene ya una presencia tangible en big data y lo que hizo durante el evento fue mostrar las ideas fuerza de lo que actualmente viene haciendo. También pudimos conversar con uno de sus ejecutivos para hablar sobre el tema.
Pero primero, veamos lo que Intel ya ofrece en el mercado.
La ampliación de la cartera de soluciones
Intel presentó durante el evento dos nuevas soluciones para big data. La primera es la distribución Intel de Apache Hadoop y la segunda es la Intel Enterprise Edition para el software Lustre.
En el caso de su distribución de Hadoop, la compañía afirma ser la primera en proporcionar un cifrado completo con soporte de Intel AES New Instructions en el procesador Intel Xeon.
Al incorporar el soporte para el cifrado basado en hardware del Hadoop Distributed File System, las organizaciones podrán analizar de forma más segura sus datos sin comprometer el desempeño. Analizar un terabyte de datos -que anteriormente tomaba más de cuatro horas- ahora se puede hacer en siete minutos gracias a la combinación del hardware de Intel y la distribución de Intel.
En cuanto a la Intel Enterprise Edition para el software Lustre, la empresa explicó que Lustre es un sistema de archivos paralelo y distribuido de fuente abierta y una tecnología clave de almacenamiento que vincula datos y permite un acceso de gran rapidez.
Intel Enterprise Edition es compatible con Lustre e incluye herramientas de gestión, así como un nuevo adaptador para Intel Distribution. La combinación de Intel Distribution e Intel Enterprise Edition permite que Hadoop se ejecute sobre Lustre, mejorando significativamente la velocidad con la que se puede acceder a los datos y procesarlos. Esto les permite a los usuarios acceder a los archivos de datos directamente desde el sistema de archivos global a tasas más rápidas y acelera el tiempo de análisis, proporcionando un uso más productivo de los recursos de almacenamiento, así como una gestión más simple del almacenamiento.
En lo académico
Intel ha creado un Centro de Ciencia y Tecnología Intel (ISTC, por sus siglas en inglés) de Big Data. Éste se encuentra hospedado en el Computer Science and Artificial Intelligence Laboratory (CSAIL) del Massachusetts Institute of Technology (MIT). El objetivo de este centro es fomentar nuevas experiencias de uso intensivo de datos que aceleren el ritmo de los descubrimientos en campos como la ciencia, la medicina y la industria.
Intel también ha lanzado GraphBuilder, un software beta y abierto que ayuda a los científicos en la industria y la academia a desarrollar nuevas aplicaciones mediante la construcción de gráficos que esquematicen las relaciones dentro de los datos.
Por otro lado, Intel Capital continúa haciendo importantes inversiones en tecnologías disruptivas para el análisis de Big Data, incluyendo 10gen de la empresa MongoDB, y el proveedor de soluciones para el análisis de big data Guavus Analytics.
La entrevista
Además de las exposiciones sobre big data tuvimos la oportunidad de conversar con Ron Kasabian, gerente general de Soluciones de Big Data del Grupo de Centro de Datos de Intel. Con este ejecutivo pudimos hablar sobre el estado actual de la industria y lo que considera que falta en ella.
Kasabian, a pesar de lo ya avanzado, considera que aún nos encontramos en las etapas iniciales de la adopción del big data y que existe todavía una falta de comprensión de lo que implica esta ola y lo que puede ofrecer a las organizaciones.
En líneas generales, ¿cuál la estrategia de Intel?
Hablamos sobre lo que está impulsando al big data desde la perspectiva de Intel, un decreciente costo del cómputo, una creciente cantidad de datos y la Internet de las cosas, todo esto está contribuyendo a esta tormenta perfecta que es la ola del big data.
Intel está pensando en cómo aprovechar sus activos existentes y capacidades para ayudar con soluciones end to end en big data. Yo vengo del TI de Intel, donde estuve muchos años, y sé que es difícil comprar partes de software de un lado y partes de hardware de otro lado, y luego tener que integrarlas todas, eso requiere de mucho tiempo y de mucho dinero.
Por ello nos concentramos en cómo poder identificar un stack de soluciones para big data que incluya -cuando sea apropiado- productos como el de McAfee, analítica end to end, una distribución de Hadoop y todas aquellas capacidades que tenemos. Además queremos hallar brechas y las organizaciones con quienes asociarnos para conversar sobre la definición de un estándar de la industria para soluciones de big data.
En resumen, nuestro foco se encuentra en cómo ayudar a las personas a reducir los costos y la complejidad de implementar big data manteniendo los datos seguros y confidenciales. Yo he llegado a este mundo en enero y he encontrado que hay muchas partes por todos lados, pero nadie está uniendo todas las piezas. Gran parte de mi trabajo es resolver el rompecabezas, descubrir dónde es que faltan piezas y resolver las brechas con nuestros socios.
Big data es para las empresas grandes pero ¿cómo podemos entregar lo mismo para las empresas medianas y pequeñas?
Es ahí donde creo que se encuentra nuestro foco. En la actualidad, creo que solo los Fortune 100 pueden utilizar big data, pero hay muchos clientes que no puede probar big data y ya no hablemos de implementarlo, entonces lo que ha descrito es exactamente lo que queremos resolver.
Ciertamente conseguimos un cierto repunte por las implementaciones en las empresas Fortune 100, pero la verdadera oportunidad de que el hardware de Intel se encuentre en las soluciones de big data se da en las empresas, no diría pequeñas, sino en las medianas a grandes que es realmente nuestro foco.
Hemos estado hablando de big data por dos o tres años, ¿cree que ya hubo bastante evangelización o se requiere hacer más?
Debido a que he estado en TI tengo bastantes contactos en la industria y por ello creo que los CIO están presionando a sus equipos para no perder esta ola, pero en realidad nadie sabe qué hacer. Entonces se descargan versiones de código abierto de Hadoop y las implementan. Todos parecen abejas ocupadas en su trabajo pero no saben que implementar Hadoop como repositorio que pueda recolectar sus datos, clasificarlos y buscarlos es tan solo el paso uno; además, creo que no saben cómo llegar al siguiente paso.
Los adoptadores tempranos usan Hadoop como una herramienta ETL (export, transform and load), lo cual es un buen primer paso. Las personas saben que hay una oportunidad y valor, pero no saben qué hacer y nosotros estamos tratando de ayudar.
Otra cosa que está pasando y que es muy confusa para las personas es que hay nuevos actores en el mercado. No escucho mucho de IBM, o marcas similares, los nombres que escuchas, desde la perspectiva de un ISV, son los de las pequeñas startups; los grandes nombres están por ahí, IBM con BigInsights se encuentra presente pero para vender servicios a megaclientes. Entonces el panorama tecnológico no ha parado de evolucionar o cambiar y eso incomoda a las personas, porque las compañías que piensas que se encontraban en una buena posición ahora podrían no estarlo o incluso no existir dentro de seis meses; nos encontramos en una especie de tiempos de caos.
Y es por eso que nosotros queremos poner un nombre como el de Intel detrás de Hadoop para que la gente sepa que va a estar aquí por mucho tiempo; Cloudera es una buena empresa pero es una empresa de unas 300 personas y una compañía como GE o AT&T puede enterrarla simplemente al soportar su contabilidad. Esa es una de las razones por las que ingresamos al negocio de Hadoop.
En general, creo que aún estamos en etapas muy tempranas. Es como los momentos previos al ERP, cuando llegaron SAP y Oracle e integraron todo para hacerlo más sencillo. Había aplicaciones en todos lados y tenías que encontrar una base de datos, un sistema operativo, una aplicación y juntarlo todo. Eso era lo que hacíamos a finales de los años 80. Y eso es lo que está pasando con big data en la actualidad, aunque quizás evolucione más rápido que el ERP.
¿Big data es el siguiente paso de la inteligencia de negocios o las empresas que están empezando a usar aplicaciones de big data están abandonando las aplicaciones de inteligencia de negocios?
Creo que la inteligencia de negocios tiene su lugar. Aún tengo mi sistema ERP que tiene mis datos de ingresos y aun necesito correr reportes de operaciones, y aun necesito saber quiénes son mis mejores 10 clientes, cómo están mis ventas actuales en comparación hace cinco años.
IDC señala que el mercado de business analytics tradicional es un negocio de 90 mil millones de dólares, su CAGR va a ser de un solo dígito; big data en la actualidad, si incluyes analítica y M2M, es un negocio de más de 60 mil millones de dólares y su CAGR es de 30%. No creo que BI se vaya como lo hicieron los mainframes sino que la gente poco a poco dejará de hablar de ella, y eso va a colocar a los proveedores en una posición interesante porque van a tener que seguir dando soporte a ese legacy.
Pero no puedo tomar un BI tradicional y montarlo sobre un Hadoop para correrlo. Es por eso que ves muchas nuevas compañías que son ágiles, ellas solo se enfocan en las cosas nuevas.
Cuando escucha a las personas hablando sobre big data ¿qué considera que no entienden del concepto?
Creo que la gente realmente no entienda las oportunidades que los insights le pueden dar. Creen que todo se trata de recolectar datos -que es importante- pero siento que las personas están comenzando por la tecnología para luego tratar de averiguar para qué es útil, y ese es un camino difícil. Por eso nosotros nos concentramos en la solución, con los clientes nos pasamos un tiempo comprendiendo el negocio, los datos que tienen -llevamos científicos de datos- y comenzamos a hacerles entender las posibilidades.
Puedo combinar la información estacional con la información de marketing, con la información económica local y con todo esto puedo tener una visión muy distinta a lo que las personas pueden querer comprar. Creo que las personas en muchas empresas aún no han abierto sus mentes a las oportunidades que pueden obtener con el big data.
¿Y si se encuentra con un CIO en el ascensor qué le diría?
¿Puedo ayudarle en algo?
Franca Cavassa, CIO Perú