Llegamos a ustedes gracias a:



Reportajes y análisis

Big Data: Los peligros de la minería de datos

[29/11/2013] Más que simples bits y bytes, big data es ahora una oportunidad de negocio de billones de dólares. Las organizaciones inteligentes, desde minoristas hasta fabricantes, están descubriendo rápidamente el poder de convertir los códigos postales e historiales de compra en conocimiento para mejorar perspectivas.
De hecho, el Instituto Global McKinsey, el brazo de investigación de McKinsey & Co., calcula que los grandes volúmenes de datos pueden aumentar las ganancias en el sector minorista en un asombroso 60%. Y un reciente estudio de Boston Consulting Group revela que los datos personales pueden ayudar a las empresas a lograr una mayor eficiencia del negocio y personalizar nuevos productos.
Pero mientras que el aprovechamiento del potencial de análisis de datos es claramente una ventaja competitiva, la minería de datos excesiva puede ser contraproducente. Dado que las empresas se convierten en expertas en cortar y rebanar los datos para revelar detalles tan personales como incumplimientos de pago de hipotecas y los riesgos de ataque al corazón, crece la amenaza de atroces violaciones a la privacidad.
Pregúntele a Kord Davis. Estratega digital y autor de Ética de Big Data: Cómo equilibrar el riesgo y la Innovación, él señala: "Los valores que infunde en sus prácticas de manejo de datos puede tener consecuencias muy reales".
Tome a Nordstrom, por ejemplo. El minorista de lujo utiliza sensores del proveedor de análisis Euclid para sacrificar la compra de información desde los smartphones de los clientes cada vez que se conectan al servicio W-iFi de una tienda; un movimiento que provocó críticas generalizadas de los defensores de la privacidad. (Nordstrom ya no está utilizando el servicio de análisis).
La tienda de ropa Urban Outfitters se enfrenta a una demanda colectiva por presunta violación de las leyes de protección al consumidor al decirle a los compradores que pagan con tarjeta de crédito que tenían que proporcionar sus códigos ZIP -lo cual no es cierto-, y luego usar esa información para obtener las direcciones de los compradores. Facebook a menudo se encuentra en el centro de controversias por la privacidad de los datos, ya sea que se trate de la defensa de sus propias políticas enigmáticas de privacidad, o respondiendo a los informes que dicen que le proporciona datos privados del usuario a la Agencia Nacional de Seguridad (NSA). Y la historia de cómo el minorista gigante Target fue capaz de deducir que una compradora adolescente estaba embarazada antes de que lo supiera su padre, son parte de la leyenda de marketing.
Agitaciones en línea, pleitos, clientes descontentos -son los desafortunados productos secundarios de lo que muchos perciben como grandes abusos de datos. De acuerdo con un estudio de septiembre del 2013, desde la empresa de gestión de la privacidad de datos Truste, uno de cada tres usuarios de Internet dicen que han dejado de usar el sitio web de una empresa o han dejado de hacer negocios con una empresa en conjunto, debido a preocupaciones sobre la privacidad.
La honestidad es realmente la mejor política
Pero los profesionales de TI están descubriendo que el equilibrio entre el poder de los algoritmos sofisticados con los derechos del consumidor, es mucho más que evitar la mala publicidad o pérdida de ventas. En estos días, vale la pena ser honesto -literalmente. "Las organizaciones que son transparentes en cuanto a su uso de los datos podrán usar eso como una ventaja competitiva", predice Davis. "La gente está empezando a estar muy interesada en lo que está pasando ahí fuera con sus datos, por lo que las organizaciones que tienen las prácticas adecuadas para compartir esa información con ética van a estar en una posición mucho mejor por ser de confianza".
Sin embargo, muchos CIO y científicos de datos están luchando con la cuestión de cómo obtener valor real y conocimientos de los datos confidenciales, sin dejar de respetar los derechos de los consumidores e incluso ganar su confianza. A medida que crece el almacén de datos, y las técnicas para la manipulación de datos se multiplican, algunos profesionales de TI están tomando el asunto en sus propias manos, con enfoques innovadores para prevenir el abuso de los datos.
Retention Science es un ejemplo perfecto. La firma de análisis de datos con sede en California utiliza algoritmos predictivos y datos como el ingreso familiar agregado, historiales de compra y las puntuaciones de crédito, para ayudar a las empresas a predecir la probabilidad de compra de un cliente y crear campañas de retención de marketing predictivo. Además de los datos suministrados por un cliente, Retention Science también se basa en los datos que licencia de los proveedores de terceros para apuntar a los consumidores correctos en el momento adecuado.
Para crear campañas específicas, respetando la privacidad del consumidor, Retention Science ha establecido reglas rígidas y rápidas que dirigen su uso de los datos de consumo. Por un lado, Retention Science se niega a compartir datos a través de los clientes. Por ejemplo, si Gap Inc. Fuera un cliente, y había suministrado datos de consumo a Retention Science, esa información nunca se compartirá -incluso de forma anónima- con otros clientes minoristas.
En otro esfuerzo por preservar la privacidad de los consumidores a pesar de la manipulación de terabytes de datos confidenciales, Retention Science insiste en que todos sus científicos de datos, muchos de los cuales son profesores e investigadores, firman acuerdos de confidencialidad. "No se les permite compartir o utilizar los datos en cualquier otro lugar o para sus propias publicaciones", señala el CEO de Retention Science, Jerry Jao.
Además de contar con sus propios empleados responsables, Retention Science también "funciona solo con las empresas que están plenamente comprometidas a obtener el consentimiento de los consumidores con antelación para que se utilicen sus datos", agrega Yao. "No queremos que incluya información de personas si no conceden acceso".
La revelación completa de las cookies
Mientras que el ajuste de los controles internos puede ayudarle, puede ir un paso más allá al ofrecer a los consumidores una mirada de primera mano sobre lo que se conoce de ellos. Una empresa que tiene una política de libro abierto como esta es BlueKai, un proveedor con sede en Cupertino, California, que ofrece una plataforma de gestión de datos que los vendedores y los editores pueden utilizar para administrar y activar datos con el fin de crear campañas de marketing dirigido. En el 2008, BlueKai decidió poner en marcha un portal en línea donde los consumidores pueden saber exactamente que cookies BlueKai y sus socios han estado recogiendo de ellos, punto por punto, en función de sus historiales de navegación.
Considere, por ejemplo, una mujer que compra, en línea, una bicicleta roja. Como ella visita diferentes sitios de artículos deportivos que se asocian con BlueKai, una colección de cookies anónimas se almacenan en su navegador. En base a este historial de navegación, los socios de marketing de BlueKai mostrarán anuncios de comportamiento en la computadora de la mujer que son relevantes para su búsqueda de bicicletas.
En estos días, la mayoría de los compradores en línea se dan cuenta de que no es una coincidencia cuando ven anuncios que están claramente vinculados a sus historiales de navegación. Pero el registro de BlueKai hace que el proceso sea más transparente, e incluso permite que los visitantes opten por el registro completo o que actualicen sus perfiles anónimos cambiando sus preferencias.
El CEO de BlueKai, Omar Tawakol, señala que la idea detrás del registro es que, "si hay datos conocidos acerca de usted que sean negociables entre las dos entidades, debe ser algo completamente controlado por el consumidor". Por esta razón, BlueKai también anima a sus socios para que publiquen versiones privadas del registro en sus propios sitios web para disipar las preocupaciones de los consumidores y promover una mayor transparencia.
"La belleza de lo que hacemos es que no sabemos quién es usted", anota Tawakol. "No queremos saber el nombre de nadie. No queremos saber nada reconocible de ellos. Lo único que queremos hacer es demostrar que sus cookies son accesibles, y que tienen estos atributos asociados a ellos".
BlueKai no es la única gran estrella de datos que está repartiendo acceso. La empresa de tecnología de marketing Acxiom fue noticia recientemente con el lanzamiento de AboutTheData.com, un sitio libre donde la gente puede ver algo de la información que la compañía con sede en Little Rock, Arkansas, ha reunido acerca de ellos. Detalles varían desde el estado civil hasta qué tipo de vehículo conduce. Los visitantes solo tienen que introducir información personal clave para averiguar lo que los anunciantes de datos están utilizando con el fin de ayudar a personalizar sus mensajes de marketing.
El hecho de que los corredores de datos de gran alcance, tales como Acxiom, estén ayudando a desmitificar las iniciativas de marketing basadas en datos no le sorprende a Tawakol de BlueKai. Él cree que las empresas no tienen otra opción más que responder a los cambios en la confianza del consumidor en torno a la privacidad de los datos. "Hace años, la gente construyó las compañías de datos en las sombras, donde los consumidores no tenían ningún control", señala. "Ahora estamos en una época diferente; los consumidores deben tener el control".
La perspectiva de Davis sobre el movimiento hacia una mayor transparencia es más cínico. Tomando nota de que "las organizaciones están empezando a enfrentar una vigilancia cada vez más estrecha en torno a sus prácticas de datos", él indica que las empresas tienen un motivo ulterior para limpiarse en el uso de la información como el código postal y cuentas de crédito: Hacerlo les ayuda a evitar problemas legales y mala prensa. Es más, agrega Davis, muchas de las iniciativas que se promocionan para ofrecerle a la gente una idea de cómo están siendo rastreados, tienen que ver más con las relaciones públicas que con la divulgación. "Lo todavía no me dice es quién compra esos datos y lo que están haciendo con ellos", anota.
Políticas bajo el fuego
Por desgracia, una mayor transparencia no siempre se traduce en una mayor comprensión. Las políticas de privacidad de los titanes de la industria, tales como Facebook y Google, han sido criticadas por ser difíciles de entender. Presentados como novelas de 70 páginas llenas de términos vagos como "información de identificación no personal", algunas políticas incluso han provocado verificaciones de los reguladores de la Comisión Federal de Comercio.
De hecho, los resultados de una encuesta de abril del 2012 hecha por la firma de estrategia de marca Siegel+Gale indicó que los usuarios tienen poca comprensión de cómo Facebook y Google sigue, almacena y comparte su información. A los participantes de la encuesta se les pidió que revisaran las políticas de privacidad de Facebook y Google para evaluar cuánto entendieron en una escala de cero a 100 (con 80 indicando una buena comprensión). Facebook alcanzó 39 y Google 36 -lo que indica mala comprensión.
"La gente no entiende lo que acepta", señala Davis. "Las organizaciones hacen que sea mucho más complicado de lo que debería ser". Además, añade, "leer todos los términos de los servicios que recibimos nos llevaría 76 días al año".
Eso no es para sugerir que las políticas de privacidad no tienen ningún valor en el mundo de los grandes datos. Más bien, anota Nans Sivaram, socio cliente en la consultora de TI y outsourcing Infosys, en lugar de compartir los términos y condiciones, las empresas deben "comunicarle a los consumidores el valor que recibirán si se pierden de cierta información".
En una reciente encuesta mundial de Infosys, el 39% de los encuestados señalaron que consideran que la minería de datos es invasiva. Y el 72% dijo que no sienten que las promociones en línea o e-mails que reciben respondan a sus intereses y necesidades personales. Sin embargo, Sivaram señala que "los consumidores están dispuestos a desprenderse de la información personal, siempre haya una buena razón para hacerlo".
El resultado: Por un lado, los consumidores desean recibir productos y servicios muy específicos y personalizados. Por otro lado, no quieren sentir que sus datos personales están en un juego comercial.
"Los minoristas tienen que hacer un trabajo mucho mejor en la utilización de los datos que ya tienen para llegar a sus clientes", anota Sivaram. "Al mismo tiempo, tienen que tener cuidado de no ser vistos como invasivos porque no querrán meterse en problemas y perder la confianza de sus clientes".
Entonces, ¿cuál es la solución? Según Sivaram, la respuesta para los que recogen big data es "establecer los incentivos adecuados" para que las personas divulguen sus datos personales. Por ejemplo, al mostrar a la gente que compartir su información puede hacerles ganar puntos de fidelidad o descuentos, las empresas pueden crear un mayor valor para sus clientes, mientras que hacen que la confianza del consumidor sea una ventaja competitiva.
La misma regla de reciprocidad también se aplica a los contenidos en línea. "Cuando a le gente le hemos preguntado en las encuestas si ¿Preferirían pagar por su contenido o preferirían anuncios dirigidos? por lo general el 90% de las personas prefieren el contenido dirigido", señala Tawakol de BlueKai:.
El establecimiento de un código de conducta
Sin embargo, no todo el mundo cree que la carga se deba colocar en los consumidores para que estén de acuerdo en compartir sus datos alegremente, descifrar confusas políticas de privacidad o intercambiar calificaciones de crédito por cupones de alimentos. Por ejemplo, Michael Walker señala que los profesionales de big data deberían adoptar un código de ética. Como socio gerente de Rose Business Technologies, un integrador de sistemas con sede en Denver y proveedor de servicios TI, Walker ha elaborado un código de la ciencia de datos de 12 páginas sobre la conducta profesional que cubre todo, desde el papel de los científicos de datos a sus responsabilidades diarias (ver recuadro).
"Las empresas están empezando a comprender el peligro de los usos secundarios de la información y cómo los datos personales de la gente pueden ser abusados", señala Walker. "Una vez que comienzan a pensar en ello, están muy a favor de un código ético".
De hecho, en una encuesta de agosto del 2013 llevado a cabo por la compañía de software estadístico Revolution Analytics, el 80% de los encuestados dijo estar de acuerdo en que debe haber un marco ético para la recopilación y utilización de datos. Y más de la mitad de los científicos de datos encuestados estuvieron de acuerdo en que la ética ya desempeña un papel importante en su investigación.           
"Mi solución es tener algún tipo de código de conducta profesional que los científicos de datos acuerden voluntariamente seguir para proteger los datos privados de las personas", agrega Walker. Mediante la creación de una especie de juramento hipocrático para los profesionales de la analítica, Walker dice que los científicos de datos tendrán razones morales y legales para negarse a cortar los números de tal forma que amenacen con violar los derechos de privacidad del consumidor.
Walker no es el primero en concebir un código de ética para los analistas. A principios de este año, el Instituto de Investigación de Operaciones y las Ciencias de la Gestión (INFORMS, por sus siglas en inglés) redactó un código de ética para acompañar el lanzamiento de su programa de certificación Certified Analytics Profesional (CAP).
Sin embargo, Davis cree que a pesar de las nobles intenciones, es demasiado fácil que un código de ética sea pasado por alto, "escrito en un pedazo de papel y puesto en un cajón". El reto, señala, "es que hay que ser realistas acerca de la comprensión de lo que realmente hacen con sus datos, y si es o no es que se alinea con los valores compartidos de la organización". Desafortunadamente, agrega el ejecutivo, determinar cuáles son sus valores como organización, y sus prácticas de datos reflejan estas prioridades, "es una conversación muy diferente a la que estamos acostumbrados a tener en un negocio".
Y luego están los profesionales de TI que sostienen que proteger la privacidad no es el trabajo de un científico de datos. En cambio, "su trabajo es extraer información interesante de los datos", señala Ryan Kalember, director de producto en WatchDox, un proveedor de herramientas de seguridad con sede en Palo Alto, California.
El mercado impulsará las respuestas
Si la privacidad está en el ámbito de los consumidores, los ejecutivos de las empresas o los científicos de datos, una cosa es cierta: la privacidad de los datos es un tema candente. Incluso el gobierno de EE.UU. está investigando a las organizaciones que recogen y gestionan grandes volúmenes de datos y las presionan para que den a los consumidores un adecuado control sobre sus datos personales. Pero los observadores de la industria no están conteniendo la respiración para el barrido de la acción gubernamental. "No es como si los 'Padres Fundadores' se estuvieran reuniendo en Filadelfia", señala Davis.
Las revelaciones en curso sobre el programa de recopilación de datos Prisma de la NSA han erosionado aún más la confianza de la opinión pública que el gobierno hará lo que sea para proteger la privacidad de los consumidores. De hecho, Tawakol señala que los cambios en la conciencia de los consumidores acerca de la privacidad de datos (o la ausencia de ella) son más propensos que las investigaciones federales para impulsar reformas en las prácticas de recolección de datos.
"El mercado va a proporcionar un mecanismo más rápido que la legislación", señala. "Va a haber más y más control de sus datos, y más claridad sobre lo que está recibiendo a cambio. Las empresas que insisten en no ser transparentes parecerán anticuadas".
Walker comparte esa visión del futuro. "Hay muchas ventajas al analizar los datos y tener empresas que adaptan estrechamente productos y servicios específicos a las preferencias del cliente. Pero en realidad está en el mejor interés de la empresa el respetar los datos privados de la gente", señala el ejecutivo, y añade que las empresas van a perder clientes "si los consumidores se enteran de que una empresa ha estado espiándolos y utilizando los datos de una manera que no es ética".
Cindy Waxer, Computerworld (EE.UU.)