Llegamos a ustedes gracias a:



Reportajes y análisis

Datos como servicio: Principales proveedores que ofrecen datos a la carta

[23/04/2022] Con las decisiones basadas en datos y los servicios digitales en el centro de la mayoría de las empresas hoy en día, las empresas nunca tienen suficientes datos para alimentar sus operaciones. Pero no todos los datos que podrían beneficiar a una empresa pueden producirse, limpiarse y analizarse fácilmente por medios internos. Los proveedores de datos como servicio son la solución: Entidades que ofrecen datos a cambio de una cuota para que su empresa los utilice.

¿Quién necesita datos como servicio (DaaS)? Cualquier persona con una empresa que anhele los datos y los necesite para ser fiable, leal, útil o cualquiera de las muchas funciones útiles. A veces, los datos que ofrecen los proveedores de DaaS proceden de su funcionamiento interno o de sus propias operaciones empresariales. Otras veces proceden de fuentes externas, a menudo abiertas, reunidas por el proveedor de DaaS para ayudar a las empresas a aprovechar los activos de datos que, de otro modo, no podrían manejar por sí mismas.

[Reciba lo último de CIO Perú suscribiéndose a nuestro newsletter semanal]

Las ofertas de DaaS llevan décadas evolucionando, pero últimamente los desarrolladores han reconocido que un modelo en la nube, con sus precios flexibles y basados en el uso, podría ayudar más fácilmente a conectar a las empresas con las fuentes de datos que los proveedores buscan monetizar. Y no se trata solo de los datos que se ofrecen. Los proveedores de DaaS también pueden mejorar la calidad de los datos que una organización podría recopilar por sí misma, corrigiendo errores o rellenando lagunas, e incluso proporcionando grandes bloques de datos en caso de que se necesiten más. De este modo, los proveedores de DaaS pueden mejorar su almacén de datos interno mediante el enriquecimiento cruzado con otras fuentes curadas.

Este ámbito está creciendo rápidamente. Algunos proveedores de DaaS hacen hincapié en la capacidad de sus herramientas para gestionar la información, analizar los datos, crear informes y apoyar la toma de decisiones. Otros impulsan los datos en sí mismos, sabiendo que tener demasiados datos es como ser demasiado rico o demasiado delgado. Todo el mundo busca más información sobre sus competidores, sus clientes, sus operaciones internas y el mundo en general.

Muchas de las herramientas también siguen la moda actual de hacer el desarrollo más sencillo e inteligente. Las opciones de bajo código y sin código están facilitando que cualquiera pueda pulsar unos cuantos botones y producir un informe o descargar una hoja de cálculo cargada de datos, todo ello sin tener que organizar una serie interminable de reuniones con los desarrolladores. Las empresas también destacan sus conexiones con buenos algoritmos de inteligencia artificial y opciones de ciencia de datos.

A continuación, se presentan una serie de opciones disponibles para ayudar a satisfacer sus necesidades de DaaS.

Proveedores de la nube: Todas las principales empresas de la nube mantienen una gran colección de conjuntos de datos abiertos para sus clientes. En muchos casos, los datos son gratuitos y se proporcionan como incentivo para utilizar los servicios de computación local. Los datos suelen estar ya convertidos y, a veces, mejorados al convertirlos al formato local para facilitar su integración con el código. Los conjuntos de datos incluyen muchas de las grandes colecciones gubernamentales, como los datos meteorológicos, así como algunas sorpresas. Azure Open Datasets, por ejemplo, incluye datos del censo y del crimen, así como algunos conjuntos de datos centrados en la comprensión del cambio climático global. AWS Open Data incluye una variedad de datos genómicos y el Common Crawl, una colección de 50 mil millones de páginas web. Los conjuntos de datos de Google Cloud incluyen patentes, información meteorológica y también los propios datos de Google producidos por el seguimiento de las búsquedas y la analítica web.

Agencias de crédito: Tres grandes empresas -Experian, TransUnion y Equifax- hacen un seguimiento de la forma en que todos nosotros pedimos préstamos y los pagamos, en un esfuerzo por computar las puntuaciones que pretenden medir la confianza en nosotros en el futuro. En el pasado, las puntuaciones en sí mismas eran bastante misteriosas y estaban ocultas, pero últimamente los bancos y las compañías de tarjetas de crédito están compartiendo las puntuaciones directamente con los clientes en un esfuerzo por fomentar un mejor comportamiento.

Las propias agencias de crédito no se conforman con trabajar solo con los prestamistas. Equifax, por ejemplo, quiere abordar problemas mayores, como la gestión de la mano de obra, el fraude, el robo de identidad y el marketing. El conocimiento de cuánto gana la gente, y cómo gasta y devuelve los préstamos puede ser útil para predecir una serie de cuestiones para sectores tan diversos como la sanidad, la automoción, la fabricación y el comercio minorista.

Ahora, las agencias de crédito están explorando nuevas formas de ofrecer respuestas. Equifax Ignite, por ejemplo, es una herramienta basada en la nube que permite analizar los datos de Equifax sin que la información personal sensible salga de las máquinas de Equifax. Produce análisis sofisticados bajo varias capas de seguridad y cumplimiento.

Enigma: Seguir el crecimiento y el desarrollo de todas las pequeñas empresas del mundo no es fácil. Enigma recopila información de diversas agencias gubernamentales y fuentes abiertas antes de mezclar detalles anónimos a nivel de transacción proporcionados por los bancos de tarjetas de crédito y débito. Si el dinero habla, entender los flujos de caja es la forma más rápida de comprender la naturaleza de un negocio.

HIRinfotech: Gran parte de la información que se puede desear suele estar ya disponible en los sitios web. HIRinfotech se especializa en recopilarla en bases de datos y luego analizarla. La empresa recopila datos sobre precios y productos en docenas de sectores, como el de los viajes y los servicios financieros. Las empresas pueden trabajar directamente con los datos y los informes, o crear otros similares utilizando algunas de las herramientas de automatización de procesos robóticos (RPA) integradas con la información raspada.

Informatica: Los equipos de marketing que necesitan información de contacto limpia y actualizada, pueden recurrir a Informatica para organizar y actualizar sus listas de contactos. El servicio de la empresa combina la verificación y el enriquecimiento. En primer lugar, las direcciones y los números de teléfono se comprueban dos veces con las bases de datos de direcciones y las bases de datos nacionales de No Llamar. A continuación, Informatica añade detalles de fuentes de confianza de empresas y consumidores para construir un expediente mejorado de contactos.

Oracle DaaS: Los vendedores que buscan una mejor inteligencia de ventas y oportunidades para abrir líneas de comunicación son los principales objetivos del producto DaaS de Oracle. La base de datos DaaS mantiene información actualizada sobre los contactos primarios y secundarios de una amplia gama de empresas. En lugar de esforzarse por mantener su Rolodex al día, la herramienta importará los nombres y contactos nuevos y actualizados a su software. Si utiliza otras herramientas de Oracle, como Eloqua, la ruta de importación ya está depurada.

Precisely: Los desarrolladores que necesitan información sobre lugares en un mapa, y las personas que viven en ellos, recurren a Precisely. Sus APIs de demografía, por ejemplo, toman una dirección o ubicación y devuelven un conjunto de estadísticas agregadas sobre las personas y los hogares dentro del radio de búsqueda. Las parcelas residenciales y comerciales se rastrean con la Property API. Algunas empresas utilizan los datos para las transacciones inmobiliarias y la planificación de la ubicación de las tiendas, pero otras utilizan la base de datos para simplificar el proceso de compra en el comercio minorista en línea. al encontrar una dirección exacta con la búsqueda de Typeahead. La empresa también crea una conexión de herramientas de procesamiento de datos para simplificar el desarrollo de mejores análisis.

RTI: La Oficina del Censo de EE.UU. bloquea las respuestas durante 72 años para proteger la privacidad de los estadounidenses, y eso puede ser mucho tiempo para esperar a hacer cualquier análisis de datos. RTI ha adoptado un enfoque diferente. En lugar de proporcionar información personalizada, ha creado un conjunto de datos sintéticos que imitan los datos reales en muchos aspectos importantes. Si en el censo real hay 58 personas en una manzana, en el conjunto de datos sintéticos encontrará cerca de 58 entradas junto con detalles inventados que intentan aproximarse a los valores reales. Cualquiera que intente analizar los datos del censo puede ejecutar sus algoritmos sin preocuparse por los datos personales. Es posible que las respuestas no sean exactamente las mismas que utilizando los datos reales, pero para muchas preguntas las respuestas serán lo suficientemente cercanas. Y eso es mejor que esperar 72 años.

Snowflake: Las empresas con datos recurren a Snowflake para almacenarlos y analizarlos en lugar de construir su propia infraestructura. La empresa ofrece una opción escalable y sin necesidad de mantenimiento que ingiere datos estructurados y semiestructurados, y luego ofrece una variedad de informes estándar y servicios de IA. El Data Marketplace también permite a los usuarios comprar y vender sus datos para mejorar la calidad de la información a través de la fertilización cruzada. Algunos de los conjuntos de datos destacados son los estudios de mercado de MSCI o S&P Global y los datos epidemiológicos de Knoema o Starschema. Hay una amplia gama de conjuntos de datos para una gran variedad de temas, desde estudios demográficos hasta marketing, medios de comunicación o deportes, incluso para el fútbol de fantasía.

Streetlight Data: Las organizaciones que se dedican a la planificación urbana y al diseño de redes de transporte necesitan saber qué hacen los residentes en las calles de la ciudad. Streetlight Data realiza un seguimiento de todas las personas utilizando registros anónimos de teléfonos móviles y fuentes gubernamentales para construir un modelo detallado de los momentos en que la gente necesita moverse por la ciudad. Con Streetlight Data, las empresas pueden obtener mediciones precisas del flujo de personas sin tener que construir sus propias redes de sensores.

Synthesis AI: Por lo general, las empresas de DaaS recopilan información real sobre el mundo. Sin embargo, Synthesis AI crea sus datos utilizando algunos de los modelos 3D y técnicas CGI que impulsan los videojuegos y las películas de acción de Hollywood. Si quiere entrenar sus rutinas de visión artificial, quizás para construir un auto autónomo, puede encontrar tantos casos de prueba como necesite. ¿Quizás su algoritmo necesite probar una calle llena de peatones borrachos en Mardi Gras? ¿O tal vez una escena en el crepúsculo justo después de que un teatro deje salir a todo el mundo? ¿O tal vez le preocupan las cuestiones éticas de trabajar con imágenes de video de niños de la vida real? Los datos sintéticos son más rápidos y completos que cualquier cosa que pueda generar un equipo de rodaje.