Llegamos a ustedes gracias a:



Noticias

Nueva herramienta calcula su deuda de big data

[22/05/2017] ¿Están sus iniciativas de transformación digital generando en su organización una deuda de datos? La startup de analítica de datos Dremio, que aún se mantiene en modo silencioso, lanzó esta semana la Big Data Debt Calculator, una herramienta gratuita para ayudarle a estimar los costos imprevistos que se derivan de la utilización de tecnologías de gestión de datos no relacionales.

El problema de la deuda de datos ha crecido a medida que las organizaciones pasan por iniciativas de transformación digital, adoptando tecnologías no relacionales que les ayudan a ser más ágiles y ofrecer una disponibilidad always on a sus usuarios. Las aplicaciones de software como servicio (SaaS, por sus siglas en inglés), productos de base de datos en la nube, NoSQL y tecnologías relacionadas proporcionan una nueva forma de crear o entregar aplicaciones de siguiente generación; sin embargo, aunque están reduciendo el time to market, los datos de negocio críticos que tienen en sus sistemas son en gran medida incompatibles con los tradicionales flujos de trabajo analíticos.

Estas nuevas aplicaciones están ayudando a las organizaciones a abordar las iniciativas estratégicas de negocio, pero también crean la necesidad de nuevas herramientas.

"Todos los datos tienen un ciclo de vida, y durante casi cuatro décadas, el ciclo de vida se ha basado en el modelo relacional, afirmó Tomer Shiran, CEO y cofundador de Dremio. "Los datos, las herramientas para crear y analizar los datos y las habilidades para dominar los datos todos han compartido y se han beneficiado de un enfoque común.

"A medida que surgió la era del big data, se crearon nuevas tecnologías para soportar las modernas estructuras de datos y entregar información a los usuarios siempre conectados, añadió. "Estos nuevos sistemas tienen un importante papel en la creación de las aplicaciones modernas, sin embargo, producen datos que son fundamentalmente incompatibles con las actuales infraestructuras analíticas como los almacenes de datos, ETL, BI y sistemas de ciencia de datos como R y Python. Como resultado, muchas organizaciones están acumulando una significativa deuda de datos".

La nueva Big Data Debt Calculator de Dremio pretende ayudar a las organizaciones a encargarse de esta deuda no planificada. Dremio afirma que da recomendaciones para minimizar la deuda, estrategias para reducirla y asegurarse de que se mantenga dentro de límites aceptables.

La calculadora toma en cuenta cuatro insumos:

  • La cantidad de datos de origen, en terabytes, almacenados en sistemas no relacionales como Hadoop, NoSQL, Amazon S3 y aplicaciones de terceros
  • El número de sistemas de origen (no servidores; un cluster Hadoop de 50 nodos cuenta como un solo sistema)
  • El número de analistas de datos que utilizan los datos
  • El número de científicos de datos que utilizan los datos

La calculadora también toma en cuenta otros dos factores:

  • Costos de responsabilidad. Dado que el big data a menudo involucra herramientas y protocolos que son menos maduros que los enfoques tradicionales, Dremio afirma que estos sistemas suponen un mayor costo de responsabilidad que debe ser considerado. Los costos incluyen pérdidas potenciales resultantes de los datos no seguros o no gobernados que se mueven por los sistemas para que sean compatibles con las herramientas utilizadas por los analistas y datos científicos.
  • Costos de oportunidad. Dremio observa que mover datos de aplicaciones hacia ambientes analíticos puede requerir de una cantidad significativa de tiempo, y reducir este tiempo puede tener costos muy altos. Algunos de los costos de oportunidad en los que se pueden incurrir incluyen el valor no conseguido como resultado de un tiempo prolongado hasta llegar al conocimiento porque los datos tuvieron que pasar por los sistemas para llegar a las herramientas utilizadas por los analistas y científicos de datos.

La calculadora utiliza estos insumos para estimar sus costos de tecnología, costos de personas y deuda total de big data.