Llegamos a ustedes gracias a:



Conversando con...

Carlos Castro, IT Architect de IBM del Perú

La precisión de la información

[23/09/2010] Un dato es una cifra única y confiable, o al menos, eso debería ser. Todo aquel que ha trabajado en una empresa sabe que los datos son la materia prima para tomar decisiones fundamentales y, a pesar de ello, las organizaciones no cuentan con una cifra confiable de un mismo dato. Los distintos departamentos de una firma pueden tener versiones totalmente distintas, aunque cercanas, de un dato. ¿Cómo es que sucede esto?

La respuesta es que no se cuida de la calidad de los datos. Éstos pueden variar tan solo en décimas de unidades, pero es suficiente para que un gerente no pueda tomar una decisión certera. Se tiene, entonces, que cuidar de la calidad de las cifras con las que se maneja la empresa, y es precisamente de ello de lo que hablamos con Carlos Castro, IT Architect de IBM del Perú. Él nos señaló algunas prácticas a tomar en cuenta.
En las organizaciones ¿generalmente existe una única fuente de información en la cual basa sus decisiones o existe más de una? ¿A qué se debe esto?
Las empresas y negocios, especialmente los dedicados al giro industrial, han pasado años comentando que es imposible llegar a niveles por encima del 95% de exactitud de inventarios, sin embargo, esto es una cuestión cultural y de disciplina. Se imaginan ustedes el impacto de una nomina con el 90% de exactitud, o que la aplicación de medicamentos a los pacientes en un hospital estuviera en un 90%, o qué les parecería que los aviones tuvieran un 98% de exactitud en los aterrizajes, o que tu cuenta de cheques del banco tuviera un nivel de exactitud por debajo del 95%, sencillamente estos porcentajes en los bancos, hospitales, aeropuertos y nominas son inconcebibles, no podemos vivir con ellos.
Los bancos tienen entre su personal trabajadores de un nivel remunerativo modesto, al igual que los hospitales y las empresas dedicadas al mantenimiento de los aviones; y, sin embargo, este personal puede realizar su trabajo a la perfección. En las empresas industriales, no obstante, existe un pretexto eterno para no alcanzar este nivel: como quieren que esté correcta la información si mis almacenistas, operarios, o compradores tienen un ingreso bajo y no tienen mucha capacidad. Esto es cuestión de expectativas y como gerentes debemos crear una expectativa alta de la calidad de la información de nuestra área, ya que ésta no solo nos impacta a nosotros sino a toda la organización.
Una vez creada la expectativa y reconocidos los beneficios de mejorar la calidad de la información, se debe aplicar una metodología para mejorar la calidad de la información en nuestro negocio. Existen muchas metodologías, pero puedo explicar brevemente la que me ha dado resultados en varios negocios.
Ante todo, debemos comprender que por desgracia, en la mayoría de empresas no existe una sola fuente de información, existen diversos sistemas formales e informales, los cuales en caso de ser erróneos pueden tener un fuerte impacto económico en su empresa.
Esto se debe básicamente a la dinámica misma de cada negocio. Por ejemplo, para decisiones de corte estratégico, la información comercial y financiera es imprescindible, y claramente ésta información proviene de diferentes áreas dentro de la organización.
Pero además, es importante mencionar que la mayoría de las empresas hacen inversiones en maquinarias, recursos humanos, sistemas, procesos; sin embargo pocas tienen presupuesto asignado en el mejoramiento de la calidad de datos, el cual es un activo crítico para la organización.
Por ejemplo, ¿cuantas veces los han llamado por teléfono para ofrecerles un producto que ustedes ya tenían? Esto sucede frecuentemente por que una persona está registrada varias veces en una base de datos. El costo de no tener información que permita identificar la unicidad de un cliente, hace que una campaña no sea lo exitosa que debería ser.
¿Cómo asegurarse entonces que cuando se tiene una fuente única, ésta contenga la información correcta?
Existen algunas iniciativas principales que van alineadas a la solución de esta problemática. La primera de ellas es el Data Governance, es decir, tener definido un Gobierno de Datos que se refiere a la gerencia de la disponibilidad, utilidad, integridad, y seguridad de los datos empleados en una organización. Se recomienda a la constitución de un cuerpo de gobierno, un sistema de procedimientos y un plan para implementar esos procedimientos. En este aspecto IBM ha desarrollado una práctica que permite abordar esta problemática de punta a punta.
Otra iniciativa es el Master Data Management (MDM). Esta solución permite almacenar, aumentar y consolidar los datos maestros, garantizando información consistente y ayudando a la optimización de la ejecución de los procesos del negocio. La implementación de una solución de este tipo ayuda a reducir drásticamente los costos asociados al mantenimiento de datos.
Hace unos años IBM compró una compañía llamada DWL, la cual era la líder en MDM en el mundo y fue rápidamente integrada al portafolio de software y servicios de IBM. Ahora, esta solución se encuentra madura y a disposición de nuestros clientes bajo el nombre de Websphere Customer Center. Contamos con experiencias con muy buenos resultados tanto cualitativos como cuantitativos.
Finalmente, las Herramientas de Calidad de Datos son otra forma de abordar esta problemática. A pesar de que las inconsistencias por temas de calidad de datos pueden ser visibles, el poder identificar la raíz de estas puede ser muy complicado, mas aún cuando se trata de información no estructurada como son nombres, direcciones, etc. Para esto es necesario utilizar herramientas especializadas para esta tarea y es donde IBM tiene un posicionamiento muy fuerte con la familia de herramientas Infosphere Information Server, la cual tiene un completo juego de herramientas que están alineadas a la metodología de Calidad de Datos que mencioné anteriormente.
¿Se tienen estadísticas de la calidad de la información que manejan las empresas en general? ¿Qué porcentaje es realmente fidedigno?
El tema de Calidad de Datos muchas veces es un tema subjetivo en las organizaciones. Es muy probable que si preguntáramos a un CIO cuál es el porcentaje de calidad de datos que tiene su empresa para la toma de decisiones, éste podría decir que es bueno, aceptable, o podría mejorarse, pero no podría responder en términos objetivos como 85% de calidad datos, 97% de calidad de datos. Esto se debe a que en el pasado no existían herramientas que pudieran cuantificar la calidad, cosa que ahora sí.
La familia Infosphere Information Server, donde se destacan productos como DataStage, QualityStage e Information Analyzer, que son herramientas de software que permiten la integración de datos y a través de algoritmos identificar (y en muchos casos solucionar) estas inconsistencias en los datos. Estas herramientas están alineadas a una metodología que permite hacer este trabajo de una manera ordenada.
¿De quién depende mantener esta fuente única y que la información sea la correcta?
Cada persona en la organización es responsable. Esto por lo general es definido en un proyecto de Data Governance, donde se formalizan los procesos y responsables de cada parte de la información.
¿Qué factores se deben de tomar en consideración para afirmar que un dato es de calidad (exactitud, relevancia, nivel de detalle, etc.)?
Más que las consideraciones al dato particular, nosotros nos enfocamos en la información. Desde nuestro punto de vista, los factores a considerar dentro de un proceso de Calidad de Datos son la Exactitud, que mide el grado en que la información refleja lo que esta pasando en el negocio (por ejemplo, exactitud de inventarios, exactitud de rutas de fabricación, de listas de materiales, etc.).
Otro factor es la Totalidad. Es decir, una medición que refleje el grado en que las bases de datos cuentan con toda la información critica para el negocio. La Oportunidad es otro factor, y éste se refiere a una medición que indique que la información está disponible cuando se la requiera para tomar una decisión.
También se debe considerar la Relevancia, esto es, que la información le sirva a la persona a quien se la está proporcionando. Otro factor es el Nivel de Detalle, es decir, que la información tenga el nivel de detalle requerido, dependiendo del nivel organizacional y al tipo de decisión al cual esté destinada. La Consistencia es otro factor a considerar, y se debe entender por Consistencia que la información sea la misma en todas las áreas o sistemas utilizados por la compañía.
Finalmente, hay que validar el trabajo sobre varias de estas consideraciones hasta hacer que nuestro objetivo no sea tan solo proveer información de calidad, sino el de apoyar a la organización a hacer un buen uso de la información.
¿Qué métodos existen para alcanzar datos de calidad? ¿Qué herramientas informáticas se pueden utilizar?
En realidad consideramos que no existe un método único para poder alcanzar la Calidad de Datos ya que es más un proceso continuo, y como primer paso de éste debemos identificar la información crítica para el negocio. Existe tanta información en una organización que difícilmente podemos dedicar suficientes recursos para mejorar la calidad de toda la información, por lo que hay que identificar cuál es la información que tiene un mayor impacto en las operaciones del negocio.
Un segundo paso es definir criterios de Calidad de Datos, esto es, definir cuándo un dato es exacto para la organización. Luego se deben realizar mediciones iniciales para detectar posibles problemas de Calidad de Datos. Este paso es un diagnóstico que nos ayuda a medir la calidad actual de la información crítica definida en el paso 1, identificando dónde se encuentran los mayores problemas y priorizando las áreas con las que hay que iniciar el esfuerzo.
El siguiente paso, el cuarto, es automatizar los Indicadores de Calidad de Información. En este paso se realizan programas que apoyen a medir periódicamente la Calidad de la Información, pues lo que no se puede medir no se puede administrar, y no se puede mejorar. Estos medidores deben estar al alcance de las personas que serán las responsables de monitorear y mejorar la calidad de la información.
Posteriormente, hay que definir Responsables de Calidad de Datos. Una de los factores críticos de éxito de un proyecto de Calidad de Datos es definir un responsable de cada indicador, esta persona debe monitorear las tendencias del indicador y realizar planes de acción encaminados a la mejora de los indicadores.
Realizar los Diagnósticos de Calidad de Datos es el siguiente paso. En estos diagnósticos se determinan las posibles causas de la mala calidad de Datos y se definen planes de acción con los responsables para mejorar el indicador. Entre los planes de acción normalmente se incluye el establecer controles preventivos y correctivos para la mejora de la calidad de Datos.
A continuación se debe realizar el Monitoreo de los indicadores por parte de la Gerencia. Si los empleados no perciben las altas expectativas por parte de la gerencia, el proyecto tendrá resultados limitados, por ello, es importante que los indicadores de Calidad de Datos se revisen periódicamente, asegurando su seguimiento y mejora continua.
Finalmente, una vez estabilizados los indicadores de Calidad de Datos, se regresa al primer punto para identificar información que tenga impacto en el negocio y cuya medición y mejora sean necesarias.
Jose Antonio Trujillo, CIO Perú