Llegamos a ustedes gracias a:



Reportajes y análisis

10 startups de big data a tener en cuenta

[22/04/2014] La importancia del Big Data está creciendo -a tal punto que muchos expertos ya lo ven como el sucesor mediático de la nube. Esto puede parecer exagerado, pero lo cierto es que el Big Data ya está a la altura de su potencial, transformando líneas completas de negocio como el marketing, la investigación farmacéutica y la ciberseguridad.
Aunque el campo es aún bastante nuevo, IDC, por ejemplo, ve grandes cosas en su futuro. La firma de investigación predice que el mercado de tecnologías de Big Data llegará a 32,4 mil millones dólares en el 2017, o alrededor de seis veces la tasa de crecimiento del mercado global de tecnologías de la información y comunicaciones.
Las startups que se muestran a continuación fueron escogidas sobre la base de un mix de validación de terceros (capitalistas de riesgo, clientes conocidos), experiencia (nivel de experiencia del equipo de gestión) y potencial de mercado (qué tan único es el producto, cuánta demanda acumulada hay para el tipo de solución, qué tan bien posicionado está frente a la competencia). También mezclamos startups algo más antiguas y a punto de convertirse en grandes con startups en sus etapas iniciales que muestran un potencial en bruto.
1. Sumo Logic
Qué hacen: Aplican el aprendizaje de máquina a las operaciones del centro de datos, utilizando el análisis de datos para establecer claramente las anomalías, predecir y descubrir los eventos potencialmente perturbadores e identificar las vulnerabilidades.
Sede: Redwood City, California.
CEO: Vance Loiselle, anteriormente vicepresidente de Servicios Globales de BMC. Se incorporó a BMC a través de la adquisición de BladeLogic, de la que fue uno de los fundadores. BMC adquirió BladeLogic por 800 millones de dólares.
Fundación: 2010.
Financiamiento: 50 millones de dólares de Accel Partners, Greylock Partners y Sutter Hill Ventures.
Por qué está en esta lista: Sumo Logic señala que aborda el muy desconocido problema de los datos de máquina: ¿cómo obtener insights acerca de los datos de los que no sabe nada al respecto? o, peor aún, ¿qué hacer cuando no se sabe siquiera lo que se debería estar buscando?
Sumo Logic sostiene que la gestión de datos de máquina -el output de cada una de las aplicaciones, páginas web, servidores y componentes de la infraestructura TI de soporte de la empresa- es el punto de partida para el análisis de datos de TI. Muchos departamentos de TI esperan ser capaces de mejorar el sistema o la disponibilidad de las aplicaciones, evitar los tiempos de inactividad, detectar los fraudes e identificar los cambios importantes en el comportamiento del cliente y las aplicaciones mediante el estudio de los logs de las máquinas. Sin embargo, las herramientas tradicionales de gestión de logs se basan en reglas predeterminadas y, por lo tanto, no ayudan a los usuarios a descubrir de forma proactiva los eventos que no se han previsto.
Anomaly Detection de Sumo Logic intenta resolver este punto débil, permitiendo a las empresas detectar automáticamente los eventos en los flujos de datos de máquina, generando insights que anteriormente no se podían descubrir dentro de toda la infraestructura de TI y de seguridad de una empresa, permitiendo la recuperación antes de que un incidente impacte los servicios empresariales clave.
Sumo Logic utiliza la tecnología de reconocimiento de patrones para condensar cientos de miles de mensajes de logs en una o dos páginas de patrones, lo que reduce drásticamente el tiempo que se tarda en encontrar la causa raíz de un problema de funcionamiento o de seguridad.
Entre sus clientes se encuentran Netflix, McGraw-Hill, Orange, PagerDuty y Medallia.
Panorama competitivo: Sumo Logic competirá con CloudPhysics, Splunk y alternativas de código abierto como Elasticsearch y Kibana.
2. Ayasdi
Qué hacen: Aplican el análisis de Big Data con el fin de resolver problemas complejos, como la búsqueda de curas para el cáncer y otras enfermedades, la exploración de nuevas fuentes de energía, la prevención del terrorismo y del fraude financiero.
Sede: Palo Alto, California.
CEO: Gurjeet Singh, quien antes fue científico de investigación en Stanford.
Fundación: La empresa fue fundada en el 2008, pero no estuvo activa hasta su lanzamiento en enero del 2013.
Financiamiento: Ayasdi ha recaudado 43,4 millones de dólares en financiamiento de capital riesgo de Floodgate, Khosla Ventures, Institutional Venture Partners, GE Ventures y Citi Ventures. La compañía también recibió 1,2 millones de dólares en subvenciones de DARPA y NSF.
Por qué está en esta lista: Según Ayasdi, desde la creación de SQL en la década de los años 80, los analistas de datos han tratado de encontrar insights haciendo preguntas y escribiendo consultas. El enfoque basado en la consulta tiene dos defectos fundamentales. En primer lugar, todas las consultas se basan en suposiciones y prejuicios humanos. En segundo lugar, los resultados de una consulta solo revelan trozos de datos y no muestran las relaciones entre los grupos de datos similares. Si bien este método puede revelar pistas sobre cómo resolver los problemas, se trata de un juego de azar que por lo general toma semanas, meses y años de trabajo en base a conjeturas.
Ayasdi cree que un mejor enfoque sería mirar la forma de los datos. Ayasdi argumenta que grandes conjuntos de datos tienen una forma distinta, o topología, y que cada forma tiene un significado importante. Ayasdi pretende ayudar a las empresas a determinar la forma en cuestión de minutos, para que puedan descubrir automáticamente los insights de sus datos sin tener que hacer preguntas, formular consultas o escribir código.
La plataforma Insight Discovery de Ayasdi utiliza Topological Data Analysis (TDA) junto con técnicas de aprendizaje de máquina para permitir a los científicos de datos, expertos en el campo y analistas de negocio optimizar sus datos sin necesidad de programación.
Entre sus clientes se encuentran GE, Citi, Merck, USDA, Hospital Monte Sinaí, Miami Heat y el CDC.
Panorama competitivo: El campo del aprendizaje de máquina es muy abierto. Ayasdi competirá contra Watson de IBM, SAS y Skytree.
3. Feedzai
Qué hacen: Feedzai utiliza el aprendizaje basado en máquina y en tiempo real, para ayudar a las empresas a evitar los fraudes.
Sede: San Mateo, California.
CEO: Nuno Sebastião. Antes de Feedzai, dirigió el desarrollo de la infraestructura de simulación de satélite de la Agencia Espacial Europea.
Fundación: 2013.
Financiamiento: Feedzai ha recaudado 4,3 millones de dólares de SAP Ventures, Data Collective y otros inversionistas internacionales.
Por qué están en esta lista: No es ninguna gran revelación de que el fraude en línea es un gran problema. Sin embargo, su impacto es a menudo subestimado. Por ejemplo, el ataque a Target podría terminar costando más de 680 millones de dólares, según el Instituto Ponemon.
Feedzai afirma que puede detectar el fraude en las transacciones de comercio, ya sea que la tarjeta de crédito está presente o no, en tiempo real. Feedzai combina inteligencia artificial (AI, por sus siglas en inglés) para construir modelos predictivos más robustos y analiza el comportamiento del consumidor de una manera que reduzca el riesgo, proteja a los consumidores y empresas contra el fraude y mantenga la confianza de los consumidores.
El software de Feedzai intenta comprender la manera en que los consumidores se comportan cuando hacen compras en algún lugar, ya sea en línea o no. Feedzai señala que su sistema de detección de fraudes agrupa tanto las compras en línea como las fuera de línea para cada consumidor por un lapso más prolongado, lo cual da como resultado tasas de detección más fiables y tempranas.
El software utiliza los datos para crear perfiles para cada cliente, comerciante, ubicación y dispositivo de punto de venta, con un máximo de tres años de historia de datos detrás de cada uno de ellos. Los perfiles se actualizan para cada consumidor después de cada transacción. Como resultado, Feedzai afirma ser capaz de detectar el fraude hasta 10 días antes que los métodos tradicionales y exponer hasta 60% más transacciones fraudulentas.
Entre sus clientes se encuentran Coca-Cola, Logica, Vodafone, Ericsson, SIB, Payment Solutions y Servebase Credit Card Solutions.
Panorama competitivo: Entre los competidores se encuentran SiftScience, Signifyd, Kount y Retail Decisions (ReD).
4. CloudPhysics
Qué hacen: Ofrecen una gestión de operaciones inteligente para cargas de trabajo virtualizadas.
Sede: Mountain View, California.
CEO: John Blumenthal, exdirector de gestión de productos de VMware.
Fundación: 2011.
Financiamiento: CloudPhysics está respaldada con 12,5 millones de dólares en financiamiento de capital de riesgo, incluyendo una reciente ronda de Series B por 10 millones de dólares dirigida por Kleiner Perkins Caufield & Byers, que se suma a los fondos anteriores de inversionistas ángeles y el Fondo de Mayfield.
Por qué están en esta lista: Las plataformas de virtualización y de gestión de nube carecen de información accionable que los administradores puedan utilizar para mejorar el diseño, configuración, operación y solución de los problemas de sus sistemas. Sin embargo, tener muchos puntos de datos no es suficiente. No todos los datos son igualmente valiosos. Con el fin de ir más allá de la captura de datos básicos, quienes toman decisiones tienen que ser capaces de validar y evaluar la información de varios y diferentes puntos de vista con el fin de tomar decisiones reales e impactantes.
La meta de CloudPhysics es analizar el conocimiento de datos de TI mundiales y utilizar la información para transformar la computación, dejando de lado los costos de máquina y humanos de una manera nunca antes posible. Hoy en día, sus servidores reciben un flujo diario de más de 100 mil millones de muestras de datos de configuración, desempeño, fallas y eventos de su base de usuarios global.
El servicio de CloudPhysics combina análisis de Big Data con simulación de centros de datos y técnicas de gestión de recursos. CloudPhysics argumenta que este enfoque revela complejidades ocultas en la infraestructura, descubre ineficiencias y riesgos que drenan y ponen en peligro los recursos y permite un análisis condicional que pueden informar todas las decisiones del centro de datos.
Entre sus clientes se encuentran Equinix, North Shore Credit Union y United Technologies.
Panorama competitivo: Este campo es escenario de verdaderas batallas en este momento. Entre los competidores se incluyen Splunk y Sumo Logic.
5. BloomReach
Qué hacen: Proporcionan aplicaciones de marketing de Big Data.
Sede: Mountain View, California.
CEO: Raj De Datta, ex emprededor residente de Mohr-Davidow Ventures y director de Marketing de Producto de Cisco.
Fundación: 2009; pero permaneció sin anunciarse hasta febrero del 2012.
Financiamiento: BloomReach ha recaudado 41 millones de dólares en tres rondas de financiamiento de Bain Capital Ventures, NEWA y Lightspeed Venture Partners.
Por qué están en esta lista: Forrester Research estima que el mercado de comercio electrónico en Estados Unidos llegará a los 37 mil millones de dólares en el 2017; en todo el mundo, el mercado ya alcanzó el billón de dólares, según eMarketer.
Conectar a estos consumidores con los productos y el contenido que ellos quieren y necesitan, significa que las empresas inteligentes acaben capturando una tajada cada vez mayor de ese mercado. Empresas como Amazon, Blue Nile e incluso Walmart ya aprovechan los datos a gran escala y las ventajas tecnológicas. Para competir con estas empresas, los minoristas más pequeños necesitan llegar a su público aumentando la precisión y la exactitud.
Organic Search de BloomReach combina la inteligencia de la web y el conocimiento de contenidos a nivel de sitio con el aprendizaje de máquina y el procesamiento del lenguaje natural para predecir la demanda y adaptar dinámicamente las páginas para que coincidan con el comportamiento y las intenciones del consumidor. Esto ayuda a las empresas a capturar hasta el 60% de los nuevos usuarios de la red. BloomReach también adopta un enfoque basado en los datos del comercio móvil, logrando mayor precisión al vincular consumidores con contenidos y productos. Esto aumenta los ingresos por visita al sitio en hasta 40% e impulsa las ventas en todos los canales comerciales.
Entre sus clientes se encuentran Guess, Deb Shops y Neiman Marcus
Panorama competitivo: Las plataformas de marketing de Big Data están apareciendo más rápido que la hierba mala después de una lluvia de primavera. Aunque gigantes como Google, Amazon e IBM tienen tecnologías similares, las mantienen in-house. Otras empresas que prestan servicios similares son Kontera, DataSong y Persado.
6. Altiscale
Qué hacen: Proporcionan Hadoop como servicio (Haas, por sus siglas en inglés)
Sede: Palo Alto, California.
CEO: Raymie Stata, que anteriormente fue CTO de Yahoo.
Fundación: Marzo del 2012.
Financiamiento: Altiscale está respaldada por 12 millones de dólares de financiamiento Serie A de General Catalyst y Sequoia Capital, junto con inversiones de patrocinadores individuales.
Por qué está en esta lista: El mercado de Hadoop como servicio está evolucionando rápidamente. Hadoop se está convirtiendo rápidamente en una tecnología clave para Big Data, pero el problema es que Hadoop es a la vez relativamente nueva y bastante complicada, por lo que es difícil para las organizaciones encontrar el talento necesario para desplegar y gestionar aplicaciones basadas en Hadoop.
El servicio de Altiscale pretende abstraer la complejidad de Hadoop. Los ingenieros de Altiscale configuran, ejecutan y administran entornos de Hadoop para sus clientes, permitiéndoles centrarse en sus datos y aplicaciones. Cuando cambian las necesidades de los clientes, los servicios cambian de escala para ajustarse -lo cual es una de las ventajas principales de un servicio basado en nube.
Entre sus clientes se encuentran MarketShare e Internet Archive.
Panorama competitivo: Amazon Web Services (AWS) es el gigante de este campo pero Altiscale también competirá con Cloudera y Hortonworks.
7. Pursway
Qué hacen: Pursway utiliza el análisis de Big Data y algoritmos propietarios para ayudar a las empresas a identificar los clientes que tienen más probabilidades de influir en la manera en la que las personas realizan sus compras en las redes sociales.
Sede: Herzliya, Israel; oficinas principales en Estados Unidos: Waltham, Massachusetts.
CEO: Dave Ellenberger, quien anteriormente se desempeñó como director general de 170 Systems.
Fundación: 2009.
Financiamiento: 17 millones de dólares de Battery Ventures y Globespan Capital Partners.
Por qué está en esta lista: En una era de iniciativas de marketing basadas en datos y atentas a los medios sociales, los proveedores están buscando cada vez más formas de liberar el poder del marketing basado en las relaciones. La mayor parte del comportamiento del consumidor se ve influida por las opiniones de la gente que conocemos y de confianza (familia, amigos y colegas). Aunque los vendedores lo saben desde hace bastante tiempo, tienen problemas para aprovechar esto.
El software de Pursway está destinado a mejorar la captación de clientes, las oportunidades de venta cruzada y la retención. Pursway argumenta que puede ayudar a las organizaciones a acortar la brecha entre cómo venden las empresas y cómo compran realmente las personas mediante la impresión de un gráfico social de los clientes existentes y de los prospectos de datos, la identificación de las relaciones actuales entre los compradores y la identificación de los clientes potenciales que tienen una influencia demostrada sobre las decisiones de compra de los demás.
Entre sus clientes se encuentran Sony, Orange y Comcast.
Panorama competitivo: Entre los competidores se encuentran Angoss, IBM y SAS.
8. PlaceIQ
Qué hacen: Proporcionan una plataforma de publicidad móvil basada en datos y de targeting al consumidor.
Sede: Nueva York, Nueva York.
CEO: Duncan McCall, quien anteriormente fundó PublicEarth.
Fundación: 2010.
Financiamiento: La compañía está respaldada por 27,75 millones de dólares gracias a tres rondas de financiamiento con IA Ventures, Leverage Social, kbs+ Ventures, Neu Venture Capital, US Venture Partners, Valhalla Partners, Harmony Partners e Iris Capital.
Por qué está en esta lista: La publicidad y el marketing móvil representan un reto único. La manera típica en que las empresas tratan de entender el comportamiento del consumidor en línea es a través de las cookies. En los teléfonos inteligentes y en las tabletas, las cookies no tienen tanta importancia. Incluso si las cookies están habilitadas en los navegadores móviles no son muy útiles, ya que los navegadores están siendo reemplazados por las aplicaciones.
Sin embargo, una mejor opción es la ubicación. Al igual que las cookies siguen sus viajes a través de la web, los vendedores pueden recoger información demográfica de las ubicaciones físicas reales que usted ha visitado.
PlaceIQ señala que proporciona una representación multidimensional de los consumidores en todo lugar y tiempo. Esto permite a las marcas definir los públicos y comunicarse de forma inteligente con ellos para apoyar un mayor retorno de la inversión.
El producto Audiences Now de PlaceIQ se centra en la ubicación de los clientes, en tiempo real, creando inmediatez en la estrategia de marketing de una marca.
Entre sus clientes se encuentran Mazda, Disney y Montana Tourism.
Panorama competitivo: Entre sus competidores se encuentran Verve Mobile, XAD, Placed, Sense Networks, JiWire, 4INFO y Millennial Media.
9. MemSQL
Qué hacen: Proporcionan tecnología in memory de base de datos para el análisis en tiempo real de Big Data.
Sede: San Francisco.
CEO: Eric Frenkiel. Antes de MemSQL, trabajó en Facebook en el desarrollo de asociados.
Fundación: 2011.
Financiamiento: La compañía está respaldada por 45 millones de dólares en financiamiento de Accel Partners, Khosla Ventures, First Round Capital y Data Collective. Su financiamiento más reciente fue de 35 millones de dólares de Serie B, cerrada en enero del 2014.
Por qué está en esta lista: Big Data y el análisis en tiempo real tienen el potencial de afectar profundamente la manera en que operan las organizaciones y cómo se involucran con los clientes. Sin embargo, hay retos que impiden a las empresas extraer totalmente el valor de sus datos. Las tecnologías de base de datos legacy son propensas a la latencia, requieren arquitecturas complejas y costosas y se basan en una lenta tecnología de disco.
El resultado es una infraestructura informática anticuada que no puede manejar la velocidad y el volumen de los datos en el plazo requerido para una verdadera solución en tiempo real.
MemSQL afirma que resuelve este cuello de botella con un modelo de computación in memory distribuido que se ejecuta en servidores commodity costo efectivo. La base de datos SQL in memory de MemSQL acelera las aplicaciones, potencia el análisis en tiempo real y combina los datos estructurados y semiestructurados en una solución de Big Data consolidada. MemSQL asegura que permite a las organizaciones tomar decisiones basadas en los datos, lo que les ayuda a mejorar la fidelidad de los clientes, descubrir ventajas competitivas y reducir los costos.
Entre sus clientes se encuentran a Comcast, Zynga, Ziff Davis y Shutterstock.
Panorama competitivo: Entre los competidores se encuentran SAP y Oracle, la plataforma de código abierto MongoDB y empresas como Aerospike y Platfora.
10. Couchbase
Qué hacen: Proporcionan tecnología de bases de datos NoSQL.
Sede: Mountain View, California.
CEO: Bob Wiederhold. Anteriormente se desempeñó como presidente y director ejecutivo de Transitive, que fue adquirida por IBM en el 2008.
Fundación: 2011.
Financiamiento: Couchbase ha recaudado un total de 56 millones de dólares en financiamiento de Adams Street Partners, Accel Partners, Mayfield Fund, North Bridge Venture Partners, Ignition Partners y DoCoMo Capital.
Por qué está en esta lista: El panorama de la tecnología de base de datos de Big Data está en actividad. Hadoop y NoSQL parecen ser las plataformas más favorables, aunque muchas organizaciones siguen apostando por SQL.
Couchbase está colocando su apuesta en NoSQL. Esta startup sostiene que su tecnología de base de datos orientada a documentos NoSQL proporciona la escalabilidad y flexibilidad de modelado de datos necesarios para los proyectos de datos a gran escala. Couchbase también afirma ofrecer la primera base de datos NoSQL para dispositivos móviles.
Entre sus clientes se encuentran AOL, Cisco, Concur, LinkedIn, Orbitz, Salesforce.com, Zynga, Amadeus, McGraw-Hill Education y Nielsen.
Panorama competitivo: Entre los competidores se encuentran MongoDB y DataStax.
Jeff Vance, Network World (EE.UU.)