Llegamos a ustedes gracias a:



Reportajes y análisis

Cómo adoptar la democratización de datos

[24/01/2023] Las empresas verdaderamente orientadas a los datos obtienen resultados empresariales significativamente mejores que las que no lo están. Según un reciente informe de IDC, los líderes obtuvieron de media dos veces y media mejores resultados que otras organizaciones en muchas métricas empresariales. En concreto, las empresas líderes en el uso de datos y análisis obtuvieron tres veces más ingresos, casi tres veces más probabilidades de reducir los plazos de comercialización de nuevos productos y servicios, y más del doble de probabilidades de mejorar la satisfacción del cliente, los beneficios y la eficiencia operativa.

[Reciba lo último de CIO Perú suscribiéndose a nuestro newsletter semanal]

Pero para obtener el máximo valor de los datos y los análisis, las empresas deben tener una cultura basada en los datos que impregne toda la organización, una cultura en la que cada unidad de negocio tenga pleno acceso a los datos que necesita en la forma en que los necesita.

Esto se denomina democratización de los datos. Hacerlo bien requiere una recopilación de datos bien pensada, una selección cuidadosa de una plataforma de datos que permita un acceso holístico y seguro a los datos, y formar y capacitar a los empleados para que tengan una mentalidad que dé prioridad a los datos. También hay que tener en cuenta los riesgos de seguridad y cumplimiento.

Partir de una base de datos sólida

Antes de elegir una plataforma para compartir datos, una organización debe conocer los datos que ya tiene y eliminarlos de errores y duplicados.

Gran parte de la preparación de los datos que se van a compartir es un ejercicio de normalización de datos, afirma Juan Orlandini, arquitecto jefe e ingeniero distinguido de Insight Enterprises.

Los formatos de datos y las arquitecturas de datos suelen ser incoherentes, y los datos pueden incluso estar incompletos. "De repente, estás tratando de dar estos datos a alguien que no es una persona de datos", señala, "y es muy fácil para ellos sacar conclusiones erróneas o engañosas de esos datos".

A menudo, las empresas recurren a ayuda externa para la normalización de datos porque, si se hace de forma incorrecta, pueden seguir teniendo problemas de calidad de datos y no pueden sacar el máximo partido de sus datos.

A medida que más empresas utilizan la nube y el desarrollo nativo en la nube, la normalización de los datos se ha vuelto más complicada.

"Podría estar en una base de datos NoSQL, una base de datos gráfica o en todos estos otros tipos de bases de datos disponibles ahora, y hacer que sean coherentes se convierte en un verdadero desafío", anota Orlandini.

Seleccionar la plataforma con tacto

En muchos casos, solo el departamento de TI tiene acceso a los datos y a las herramientas de inteligencia de datos en las organizaciones que no practican la democratización de los datos. Por eso, para que los datos sean accesibles a todos, se necesitan nuevas herramientas y tecnologías.

Por supuesto, el costo es una consideración importante, indica Orlandini, así como decidir dónde alojar los datos y tenerlos disponibles de una manera fiscalmente responsable. Una organización también puede preguntarse si los datos deben mantenerse en las instalaciones debido a problemas de seguridad en la nube pública. Pero Kevin Young, consultor senior de datos y análisis de la consultora SPR, afirma que las organizaciones pueden compartir primero los datos creando un lago de datos como Amazon S3 o Google Cloud Storage. "Los miembros de toda la organización pueden añadir sus datos al lago para que todos los departamentos los consuman", sostiene Young. Pero sin el cuidado adecuado, un lago de datos puede acabar desorganizado y lleno de datos inservibles. La mayoría de las organizaciones no acaban teniendo lagos de datos, anota Orlandini. "Tienen pantanos de datos", afirma.

Pero los lagos de datos no son la única opción para crear un repositorio de datos centralizado.

Otra es a través de un tejido de datos, una arquitectura y un conjunto de servicios de datos que proporcionan una visión unificada de los datos de una organización, y permiten la integración de varias fuentes en las instalaciones, en la nube y en dispositivos periféricos.

Una estructura de datos permite combinar conjuntos de datos sin necesidad de hacer copias y puede reducir la probabilidad de que existan silos.

Hay muchos proveedores de software de tejido de datos, como IBM Cloud Pak for Data y SAP Data Intelligence, que fueron nombrados líderes en el informe Enterprise Data Fabric Q2 2022 de Forrester. Pero con tantas opciones disponibles, puede ser difícil saber cuál elegir.

Lo más importante es analizar y supervisar los datos, señala Amaresh Tripathy, líder global de análisis en la firma de servicios profesionales Genpact.

"Existen muchas plataformas", afirma. "Elija cualquier plataforma que le sirva, pero debe ser automatizada y visible". Además, los datos deben ser fácilmente accesibles desde una plataforma de autoservicio que facilite la elaboración de informes de análisis de datos, incluso para personas sin experiencia técnica. "Como un portal donde la gente pueda ver todos los datos, lo que significan, cuáles son las métricas y de dónde provienen", indica Tripathy.

No existe la herramienta perfecta, y a menudo hay un equilibrio entre lo bien que una herramienta hace el linaje de datos, la catalogación de datos, y mantiene la calidad de los datos. "La mayoría de las organizaciones intentan resolver los tres problemas a la vez", añade Tripathy. "A veces se excede en uno y no obtiene un valor muy bueno en otro". Así que una organización debe decidir qué es lo más importante, señala. "Deben saber por qué lo hacen, qué herramienta les da el mejor rendimiento en esas tres dimensiones, y luego tomar la decisión adecuada".

Al pensar en cómo compartir datos, una organización también puede considerar la implementación de una malla de datos, que adopta el enfoque opuesto al tejido de datos. Mientras que el tejido de datos gestiona múltiples fuentes de datos desde un único sistema virtual centralizado, una malla de datos es una forma de arquitectura de datos empresariales que adopta un enfoque descentralizado y crea múltiples sistemas de dominio específico.

Con una malla de datos, las organizaciones pueden ayudar a garantizar que los datos se manejan adecuadamente poniéndolos en manos de quienes mejor los entienden, sostiene Chris McLellan, director de operaciones de Data Collaboration Alliance, una organización mundial sin ánimo de lucro que ayuda a personas y organizaciones a obtener el control total de sus datos. Puede tratarse de una persona, como el director financiero, o de un grupo de personas que actúen como administradores de datos.

"En el fondo, se trata del concepto de datos como producto", explica. "Y un producto de datos es algo que puede ser propiedad de alguien con experiencia en la materia y que puede encargarse de su gestión".

La implantación de una arquitectura de malla de datos permite a una organización poner conjuntos de datos específicos en manos de expertos en la materia. "Estas personas están más cerca de la normativa, el cliente y los usuarios finales", afirma McLellan. "Están más cerca de todo lo relacionado con ese dominio específico de información".

La malla de datos no está vinculada a ninguna herramienta específica, por lo que los equipos individuales pueden elegir las que mejor se adapten a sus necesidades, y no existe el cuello de botella de que todo tenga que pasar por un equipo de datos central.

"Estamos asistiendo a una descentralización no solo de las TI o de la entrega de aplicaciones, sino también de la gestión y el gobierno de los datos", afirma McLellan, "lo cual es positivo, porque los responsables de marketing conocen las leyes de protección del consumidor mejor que el equipo de TI, y los de finanzas conocen la normativa financiera mejor que los de TI".

Aunque hay muchos proveedores que venden malla de datos, sigue siendo un objeto nuevo y brillante, advierte Forrester, y tiene sus retos, como los conflictos en cómo se define, las tecnologías que utiliza y su valor.

Formación y gestión del cambio

Una vez establecida una arquitectura para la democratización de los datos, los empleados deben comprender cómo trabajar con los nuevos procesos de datos. Los empleados pueden recibir los datos adecuados; pero, aunque estén formados como administradores o contables, no necesariamente van a saber qué hacer con ellos, afirma Orlandini, de Insight. El acceso a los datos no basta por sí solo para que una organización se rija por ellos. "Hay que impartir formación", afirma. "Si no lo hace bien, tendrá un éxito desigual en el mejor de los casos, o puede que sea un fracaso".

Algunas organizaciones han puesto en marcha sus propios programas de formación interna para asegurarse de que los empleados entienden cómo interpretar y manejar adecuadamente los datos.

Genpact, por ejemplo, introdujo el año pasado lo que denomina su iniciativa DataBridge para aumentar los conocimientos sobre datos en toda la organización.

"Nuestra intención no era convertir a 100 mil personas en ciudadanos científicos de datos", señala Tripathy. "Proporcionamos la concientización en el contexto de cómo hacen su trabajo". Por ejemplo, un empleado que realiza análisis de siniestros no necesita aprender todo sobre detección de anomalías: lo que necesita entender es qué significa para él la detección de anomalías. "Puede que tenga o no todos los conocimientos necesarios para analizar los datos por sí mismo, pero debería ser capaz de plantear una pregunta y buscar ayuda, y ser capaz de plantear esa pregunta de la forma adecuada es el aspecto de la conciencia de los datos", añade.

Sentar las bases de la seguridad y el cumplimiento

Para mantener la integridad de los datos y evitar costosas sanciones, es necesario implantar desde el principio una gobernanza de datos adecuada.

Junto con los responsables de TI, los equipos de seguridad y cumplimiento deben formar parte de la conversación inicial, afirma Orlandini, de Insight. "Es un gran reto, y muchas organizaciones se enfrentan a él", afirma, añadiendo que es un requisito previo que la dirección de la empresa entienda exactamente lo que ofrece para compartir, y se asegure de que se ofrece a las personas adecuadas.

"Vivimos en un mundo muy regulado en el que hay que tener mucho cuidado", anota, "especialmente en sectores como el de la salud y las finanzas, donde hay leyes que tienen graves consecuencias si se permite que la persona equivocada tenga acceso a los datos equivocados".

También hay herramientas que ayudan a las organizaciones con el enmascaramiento de datos y la ofuscación de datos para evitar revelar información de identificación personal. "Puede empezar a obtener información sin revelar datos de identificación personal, registros de la HIPAA o cualquiera de los requisitos normativos que existen", continúa.

"También hay herramientas con controles de acceso basados en atributos en los que realmente se etiquetan los datos con tipos muy específicos de atributos -esto tiene PII o HIPAA, cualesquiera que sean sus atributos- y luego solo se tiene acceso a los datos con el tipo correcto de atributos asociados a ellos".

De este modo, los datos se controlan automáticamente, y están disponibles en una nube pública o en un entorno híbrido con datos en múltiples ubicaciones, o incluso en entornos privados con estrictos controles de cumplimiento que pueden establecerse.

Beneficios a largo plazo

La democratización de los datos no solo puede ayudar a una empresa a acelerar sus flujos de datos, sino que también puede capacitar a las personas para encontrar nuevas formas de resolver problemas a través de un mejor conocimiento de cómo analizar y trabajar con los datos.

Gartner afirma que, al adoptar la democratización de datos, las organizaciones pueden resolver la escasez de recursos, reducir los cuellos de botella y permitir que las unidades de negocio gestionen sus propias solicitudes de datos con mayor facilidad. Al democratizar los datos, las organizaciones pueden mejorar su toma de decisiones al permitir que más personas contribuyan al análisis y la interpretación de los datos; aumentar la colaboración entre equipos dentro de una organización; y mejorar la transparencia, ya que más personas tienen acceso a la información y pueden ver cómo se toman las decisiones basadas en datos.

Puede ver también: