Llegamos a ustedes gracias a:



Reportajes y análisis

22 herramientas gratuitas para la visualización y análisis de datos

¿Tiene datos? Estas herramientas útiles pueden convertirlos en gráficos informativos y atractivos.

[16/06/2017] Puede pensar que no tiene mucho en común con un periodista de investigación o un investigador médico académico. Pero si está tratando de extraer información útil de un flujo cada vez mayor de datos, es probable que la visualización sea útil, ya sea para mostrar patrones o tendencias con gráficos en lugar de montañas de números, o para tratar de explicar problemas complejos a una audiencia no técnica.

Hay muchas herramientas para ayudarle a convertir datos en gráficos, pero pueden costar mucho dinero. El costo puede tener sentido para los profesionales cuyo trabajo principal es encontrar sentido en montañas de información, pero tal vez no pueda justificar tal gasto si usted o sus usuarios solo necesitan una aplicación de gráficos de vez en cuando, o si su presupuesto para nuevas herramientas es algo limitado. Si una de las opciones de precio más alto está fuera de su alcance, hay un número sorprendente de herramientas muy robustas para la visualización y análisis de datos que están disponibles sin costo alguno.

Van desde lo suficientemente fácil para un principiante (es decir, cualquier persona que puede hacer una rudimentaria hoja de cálculo para ingresar datos) hasta un experto (que requiere la práctica de codificación). Pero todos comparten una característica importante: son libres. Su principal inversión: el tiempo.

LIMPIEZA DE DATOS

Antes de poder analizar y visualizar datos, a menudo es necesario limpiarlos. ¿Qué significa eso? Tal vez algunas entradas digan "Nueva York", mientras que otras dicen "Nueva York, NY" y es necesario normalizarlas antes de que pueda ver los patrones. Puede haber algunos registros con errores ortográficos o errores numéricos de ingreso de datos. Las herramientas de "limpieza" están diseñadas para ayudar a que sus datos sean analizados durante el período.

DataWrangler (y posteriormente Trifacta)

Lo que hacen: El servicio basado en web de DataWrangler, del Grupo de visualización de la Universidad de Stanford, está diseñado para limpiar y reorganizar los datos de manera que estén en una forma tal que otras herramientas, como una aplicación de hoja de cálculo, puedan utilizar.

Haga clic en una fila o columna y DataWrangler le sugerirá cambios. Por ejemplo, si hace clic en una fila en blanco, aparecen varias sugerencias como "eliminar fila" o "eliminar filas vacías".

También hay una lista de historial que permite deshacer las acciones de forma fácil -una característica que también está disponible en Open Refine (reseñada más adelante).

El equipo detrás de Data Wrangler luego fue a trabajar en el producto comercial de Trifacta, aunque el servicio todavía se puede utilizar con la URL de arriba. Trifacta es software de escritorio. La versión gratuita permite a un usuario (sin colaboración) la importación de archivos CSV, JSON, texto y Excel locales.

Lo que es genial: La edición de texto es especialmente fácil en DataWrangler. Por ejemplo, cuando seleccioné "Alabama" en una fila de datos de muestra titulada "Delito reportado en Alabama", y luego seleccioné "Alaska" en el siguiente grupo de datos, me sugirió extraer cada nombre de estado. Mueva el mouse sobre una sugerencia y puede ver las filas afectadas resaltadas en rojo.

DataWrangler ayuda a tabular y dar formato a los datos para que puedan ser utilizados y analizados por otras aplicaciones.
DataWrangler

Inconvenientes: Encontré cambios inesperados cuando intenté explorar las opciones de DataWrangler; Siempre tuve que hacer clic en "borrar" para restablecerlo. Y no todas las sugerencias son útiles ("promover la fila a la cabecera" parecía una sugerencia extraña cuando la fila estaba en blanco), o fáciles de entender ("Divida 1 con la tecla 2").

Nivel de habilidad: Principiante avanzado

Se ejecuta en: Cualquier navegador web para Data Wrangler; Windows o macOS X para Trifacta

Más información: Hay un screencast en la página principal de Data Wrangler. Además, vea este post sobre el uso de DataWrangler para darle formato a datos (del blog de Tableau Public). Para más información sobre Trifacta, vea su página de recursos.

OpenRefine (anteriormente Google Refine)

Lo que hace: OpenRefine se puede describir como una hoja de cálculo en esteroides para darle una primera mirada tanto al texto como a los datos numéricos. Al igual que Excel, puede importar y exportar datos en varios formatos, incluyendo archivos de texto separados por tabuladores y comas.

OpenRefine ayuda a limpiar los datos desordenados.
OpenRefine

OpenRefine cuenta con varios algoritmos integrados que buscan elementos de texto que deben agruparse. Después de importar sus datos, puede seleccionar editar celdas -> cluster, y editar y elegir qué algoritmo desea utilizar. Después de ejecutar OpenRefine, decide si acepta o rechaza cada sugerencia. Por ejemplo, podría decir sí a la combinación de Microsoft y Microsoft Corp., pero no a la combinación de Coach Inc. con CQG Inc. Si está ofreciendo muy pocas o muchas sugerencias, puede cambiar la fuerza de la función de sugerencias.

También hay opciones numéricas que ofrecen vistas rápidas y sencillas de las distribuciones de datos. Esta funcionalidad puede revelar anomalías que podrían ser el resultado de errores de entrada de datos -como 800.000 dólares en lugar de 80.000 dólares para ingresar un salario- o podría exponer inconsistencias, tales como diferencias en la forma en que se reportan los datos de compensación de entrada a entrada, con algunas que muestran, por ejemplo, salarios por hora y otras que muestran salario semanal o salarios anuales.

Más allá de la limpieza de datos, OpenRefine ofrece algunas herramientas útiles de análisis, tales como clasificación y filtrado.

Lo que es genial: Una vez que se acostumbre a lo que hacen los comandos, ésta es una poderosa herramienta para la manipulación de datos y el análisis que ofrece un buen equilibrio entre la funcionalidad y facilidad de uso. La lista de deshacer/rehacer de cada acción que ha tomado, le permite retroceder cuando sea necesario. También puede almacenar historiales de comandos para ejecutarlos de nuevo. Y las funciones de texto manejan expresiones regulares de sintaxis de Java, lo que le permite buscar patrones (como digamos, tres números seguidos por dos dígitos), así como cadenas de texto y números específicos.

Por último, aunque se trata de una aplicación basada en navegador, funciona con archivos en el escritorio, por lo que los datos permanecen locales.

Inconvenientes: Si tiene un conjunto grande de datos, dedique un poco de tiempo en su día para pasar por todos los cambios sugeridos por Refine, ya que puede tomar un tiempo. Y, dependiendo del conjunto de datos, esté preparado cuando busque elementos de texto para combinar, ya que es probable que obtenga una gran cantidad de falsos positivos o problemas perdidos -o ambos.

Nivel de habilidad: Principiante avanzado. El conocimiento de los conceptos de análisis de datos es más importante que la destreza técnica; los usuarios de Excel que entienden las necesidades de limpieza de datos deben estar cómodos con esto.

Se ejecuta en: Windows, macOS X (si parece que no hace nada después de cargarlo en un Mac, apunte a un navegador manualmente en http://127.0.0.1:3333/), Linux.

Más información: Estas tres grabaciones de pantalla dan una buena visión general de cómo y por qué tendrá que utilizar Refine; también hay documentación bastante detallada en GitHub.

ANÁLISIS ESTADÍSTICO

A veces es necesario combinar la representación gráfica de sus datos con el análisis numérico fuerte.

El Proyecto R para la computación estadística

Lo que hace: El Proyecto R empezó la vida como un lenguaje de análisis estadístico con soporte incorporado para gráficos y manejo de ciertos formatos de datos comunes, como hojas de cálculo y columnas. Miles de paquetes complementarios más tarde, también se utiliza para la asignación, cuadros de mando, aplicaciones web interactivas y mucho más.

El Proyecto R proporciona una amplia gama de opciones de análisis de datos.
El Proyecto R para la computación estadística

Lo bueno: Hay una gran cantidad de funcionalidad en R, incluyendo un buen número de opciones de visualización, así como análisis numérico y espacial. Y la comunidad de R está contribuyendo al lenguaje todo el tiempo, y es generalmente sensible y provechosa.

Secreto: Soy fan desde hace tiempo.

Inconvenientes: El hecho de que R se ejecute en la línea de comandos significa que los usuarios tendrán que tomar el tiempo necesario para saber qué comandos hacen qué, y no todos los usuarios se sentirán cómodos con una interfaz de solo texto. Algunos todavía se quejan de que el lenguaje es lento, aunque los entusiastas responden que esto por lo general se puede fijar con mejor código y herramientas de datos de clase empresarial como Microsoft R Server.

Nivel de habilidad: Intermedio a avanzado. La comodidad con las instrucciones de línea de comandos y un conocimiento de las estadísticas son lo más importante para la aplicación principal.

Se ejecuta en: Linux, macOS X, Unix, Windows

Más información: busque la Guía para principiantes en R de Computerworld (en inglés) y nuestra lista de los 60+ recursos para mejorar sus habilidades de R.

APLICACIONES Y SERVICIOS DE VISUALIZACIÓN

Estas herramientas ofrecen una serie de diferentes opciones de visualización. Mientras que algunas se adhieren a gráficos convencionales y tablas, muchas ofrecen una gama de otras opciones, tales como árboles y nubes de palabras. Unas pocas ofrecen mapeo también, aunque si está interesado en mapas, nuestras secciones sobre GIS/mapping se centran específicamente en eso.

Google Fusion Tables

Lo que hace: Esta es una de las formas más simples que he visto para convertir datos en un gráfico o mapa. Puede cargar un archivo en varios formatos diferentes y luego elegir cómo mostrarlo: tabla, mapa, gráfico de líneas, gráfico de barras, gráfico circular, diagrama de dispersión y más. Es personalizable, lo que le permite cambiar los íconos de mapas y el estilo de las ventanas de información.

Google Fusion Tables es una herramienta fácil de usar, que hace que sea fácil mapear los datos.
Google Fusion Tables

Hay algunas funciones de edición de datos dentro de Fusion Tables, aunque cambiar más de unas cuantas entradas de celda individuales puede convertirse en algo tedioso. También puede unir tablas (lo cual es importante cuando los datos que desea asignar están en varias tablas), y filtrar, ordenar y agregar columnas y así sucesivamente.

La cartografía va más allá de la simple colocación de puntos, como muchos de nosotros estamos acostumbrados a usar Google Maps. Las tablas de fusión también pueden correlacionar polígonos múltiples con variaciones de color basados en datos subyacentes.

Google le permite designar sus datos como privados o no listados, así como públicos, aunque sus datos todavía residen en los servidores de Google, un beneficio o inconveniente, dependiendo de si los costos de ancho de banda del servidor o la privacidad de los datos son más importantes para usted.

Lo que es genial: Fusion Tables ofrece una cartografía y un mapeo relativamente rápido, incluyendo funciones de sistema de información geográfica (GIS, por sus siglas en inglés) para analizar datos por geografía. El servicio también geocodifica direcciones automáticamente, lo cual es útil cuando se intenta colocar numerosos puntos en un mapa. Esta es una excelente herramienta para principiantes y principiantes avanzados que deseen estar cómodos con la visualización de datos; también es un buen ajuste para las personas que no programan. Para los usuarios más avanzados, hay una API.

Inconvenientes: La funcionalidad, la personalización y la capacidad de datos son limitadas en comparación con las aplicaciones de escritorio o el código personalizado, y la interacción con grandes conjuntos de datos del sitio puede ser lenta. Y, mientras que Fusion Tables ha existido por años, Google todavía lo considera un producto experimental.

Nivel de habilidad: Principiante

Se ejecuta en: Cualquier navegador web

Más información: Ver tutorial de tres minutos de Google sobre cómo hacer un mapa en Google Fusion Tables. Además, hay otros tutoriales en el centro de ayuda de Google Fusion Tables, y están disponibles varios tutoriales. Vea también Fusion Tables Example Gallery.

Microsoft Power BI

Lo que hace: Esta es la plataforma general de BI de Microsoft, con discusión de datos y visualización para muchas fuentes de datos diferentes (sin límites de filas de Excel), así como un servicio web que permite la transmisión de datos y actualizaciones de datos programadas.

Creación de un gráfico de barras en Power BI.
Microsoft Power BI

Power BI fue diseñada para un análisis de datos robusto que va más allá de las capacidades naturales de Excel. Con el objetivo de ser simple, ofrece visualizaciones de arrastrar y soltar, así como la capacidad de crear informes de actualización automática y cuadros de mando. Hay software de escritorio gratuito, que incluye capacidades de búsqueda de datos y es solo para Windows, y un servicio cloud de powerbi.com para visualizar datos que pueden ejecutarse en cualquier navegador moderno. A partir de junio del 2017, el intercambio privado en powerbi.com requiere cuentas pagadas, pero los usuarios libres todavía pueden publicar visualizaciones públicas, así como utilizar el software de escritorio.

Lo que es genial: Es simple de usar para visualizaciones básicas y creación de informes, y hace bastante fácil la exploración de datos. Manejará archivos demasiado grandes para Excel. La personalización y el filtrado también son bastante sencillos. Ejecuta scripts R dentro del software de escritorio y puede generar muchas visualizaciones R.

Inconvenientes: La personalización puede ser un poco engorrosa y algo limitada. Moverse hacia adelante y hacia atrás entre el escritorio y el servicio de la nube puede ser un poco confuso desde el principio. El filtrado de datos es también un poco limitado a veces, aunque Microsoft está agregando mensualmente nuevas capacidades a la plataforma.

Nivel de habilidad: Principiante

Se ejecuta en: Windows para el escritorio; cualquier navegador web para el servicio

Más información: Vea los recursos de formación de Microsoft.

Tableau Public

Lo que hace: Esta herramienta puede convertir datos en cualquier tipo de visualizaciones, de simples a complejas. Puede arrastrar y soltar campos en el área de trabajo y pedir al software que sugiera un tipo de visualización, luego personalizar todo, desde etiquetas y consejos de herramientas hasta tamaño, filtros interactivos y visualización de leyendas.

Tableau Public puede convertir datos en cualquier tipo de visualizaciones, de simples a complejas.
Tableau Public

Lo que es genial: Tableau Public ofrece una variedad de formas de mostrar datos interactivos. Puede combinar múltiples visualizaciones conectadas en un único tablero de instrumentos, donde un filtro de búsqueda puede actuar en numerosos gráficos, gráficos y mapas; también se pueden unir tablas de datos subyacentes. Y una vez que se da cuenta de cómo funciona el software, su interfaz de arrastrar y soltar es mucho más rápida que la codificación manual en JavaScript o R para la mayoría de los usuarios, lo que hace más probable que intente escenarios adicionales con su conjunto de datos. Además, puede realizar fácilmente cálculos de datos dentro del software. Tableau ofrece 10GB de almacenamiento para cuentas públicas y 15 millones de filas por libro de trabajo.

Inconvenientes: En la versión gratuita del software de inteligencia empresarial de Tableau, su visualización y los datos deben residir en el sitio de Tableau. Cada vez que guarda su trabajo, se envía al sitio web público, lo que significa que no puede guardar el trabajo en curso sin correr el riesgo de que se vea antes de que esté listo (si bien el sitio de Tableau no expondrá deliberadamente su trabajo, se basa en la seguridad por la oscuridad -por lo que alguien podría ver su trabajo si él o ella adivina su URL). Y una vez que su trabajo se guarda, los espectadores están invitados a descargar todo el libro con datos. La actualización a una suscripción personal para un solo usuario cuesta 35 dólares/mes; la edición profesional cuesta 70 dólares/mes.

La curva de aprendizaje de Tableau es más pronunciada que, por ejemplo, Fusion Tables. Incluso con la interfaz de arrastrar y soltar, necesitará más de una hora o dos para aprender a utilizar las verdaderas capacidades del software, aunque puede poner en marcha y ejecutar gráficos y mapas sencillos en poco tiempo.

Nivel de habilidad: Principiante avanzado a intermedio

Se ejecuta en: Windows; Mac OS X

Más información: Hay varios videos cortos de capacitación en el sitio de Tableau, donde también se pueden encontrar los archivos de datos descargables que se pueden utilizar para seguir adelante.

Google Data Studio

Lo que hace: Este servicio está diseñado para crear paneles de control e informes de varias fuentes de datos. El foco está en fuentes de Google, como Google Sheets, Google Analytics y BigQuery, pero también se admiten otras fuentes, como las bases de datos MySQL y PostgreSQL.

Ejemplo de informe en Google Data Studio.
Google Data Studio

Es bastante fácil de usar, ofrece visualizaciones de arrastrar y soltar como series de tiempo, gráficos de barras, tablas, mapas y "tarjetas de puntuación" (una tarjeta que llama a una estadística). El estilo incluye una rejilla y opciones de alineación, lo que facilita asegurarse de que las cajas múltiples no estén ligeramente fuera de una fila. También puede crear sus propios campos calculados dentro de Data Studio, incluyendo fórmulas con algunas docenas de funciones disponibles.

Lo que es genial: Relativamente fácil de usar -lo hice funcionar después de ver un par de videos tutoriales. Una de las maneras más fáciles de crear paneles de control de Google Analytics para varios sitios web.

Inconvenientes: Es un producto beta, lo que significa que hay un riesgo mayor que el promedio de que se cierre (o que ya no sea gratuito). Tiene un número limitado de visualizaciones disponibles en comparación con otras opciones. Los datos tienen que residir en la nube, lo que podría significar un reparto de interruptores para una cierta información sensible.

Nivel de dificultad: Principiante

Se ejecuta en: Cualquier navegador web

Más información: Consulte los tutoriales en video de Google Data Studio.

Plotly

Lo que hace: El servicio web le permite crear y alojar visualizaciones, desde gráficos básicos y diagramas de dispersión hasta gráficos estadísticos, como histogramas y gráficos de bloques.

Edición de una visualización de muestra en Plotly.
Plotly

Plotly tiene como objetivo el análisis estadístico junto con gráficos y tablas que puede ver en su periódico local. Una cuenta gratuita incluye un archivo privado, así como archivos públicos ilimitados y conexiones a siete tipos de fuentes de datos.

Plotly también abrió su biblioteca JavaScript, para aquellos que quieren trabajar con sus datos de forma local y hacer más personalizaciones; bibliotecas para Python y R; y un cliente para MATLAB. Incluso hay un complemento gratuito de Excel.

Lo que es genial: Es relativamente fácil hacer visualizaciones interactivas en el servicio, y la tecnología puede utilizarse en una amplia variedad de plataformas.

Inconvenientes: Incluso con la personalización, las visualizaciones de Plotly tienen un aspecto distintivo que puede que no sea para todos. Hay un uso gratuito limitado de datos privados en el servicio.

Nivel de habilidad: Principiante para servicio web; experto para la mayoría de las bibliotecas de código abierto.

Se ejecuta en: Navegadores web modernos

Más información: consulte los recursos en el Centro de asistencia de Plotly.

Qlik Sense Desktop

Lo que hace: Esta herramienta de multiuso de inteligencia empresarial, BI por sus siglas en inglés, puede escudriñar y crear visualizaciones de datos interactivos, informes y cuadros de mando.

Panel de ejemplo en Qlik Sense Desktop.
Qlik Sense Desktop

La aplicación de escritorio Qlik gratuita está diseñada para la exploración de datos personales, o para compartir en pequeños grupos. Si quiere colaborar o compartir, Qlik Sense Cloud es gratuita para compartir con otros cinco usuarios.

Puede preparar los datos antes de cargarlos, crear asociaciones de varias fuentes, editar en la aplicación, y crear visualizaciones como gráficos combo y mapas de árbol.

Lo que es genial: Se trata de una aplicación gratuita bastante robusta, y todos los datos se pueden guardar localmente. Las fuentes de datos pueden incluir Apache Hive, REST y Salesforce, así como otros tipos, tales como bases de datos y hojas de cálculo.

Inconvenientes: Con el poder llega la complejidad: tendrá que invertir algo de tiempo aprendiendo esta aplicación. Algunos de los últimos videos tutoriales de introducción asumen que conoce la versión anterior del producto, en lugar de centrarse en quienes son principiantes para la plataforma.

Nivel de habilidad: Principiante avanzado a intermedio

Se ejecuta en: Windows de 64 bits

Más información: Tutoriales de video Qlik.

VIDI

Lo que hace: Aunque el sitio web de VIDI factura esto como una herramienta para el sistema de gestión de contenido de Drupal, los gráficos creados por el asistente de visualización del sitio pueden utilizarse en cualquier página HTML.

Cargue sus datos, seleccione un tipo de visualización, realice un poco de personalización y su gráfico, línea de tiempo o mapa estará listo para usarse a través del código de inserción generado automáticamente (mediante un iframe, no en JavaScript o Flash).

Los gráficos creados por el asistente de visualización de VIDI se pueden utilizar en cualquier página HTML -no se requiere Drupal.
VIDI

Lo que es genial: Es fácil de usar, con opciones de asignación y sin necesidad de hacer su visualización y conjunto de datos públicos en su sitio web. Existen screencasts rápidos que explican cada tipo de visualización y varias opciones de personalización de colores diferentes.

Desventajas: Sorprendentemente, el asistente de visualización fue más fácil de usar que el código de inserción -mi iframe incrustado no se visualizó mientras intentaba obtener una vista previa en el sitio web de VIDI; tuve que guardar la visualización e ir a la página "My VIDI" para obtener el código de incrustación que realmente funcionaba. Además, al igual que con cualquier servicio en la nube, si está utilizando esto para publicar en la Web, tendrá que estar seguro de que los servidores del host pueden manejar su tráfico y de que estarán disponibles más tiempo que su necesidad de mostrar los datos.

Nivel de habilidad: Principiante

Se ejecuta en: Cualquier navegador web

Más información: La página principal de VIDI cuenta con un enlace a un tutorial de video.

Me tomó menos de cinco minutos poder crear una muestra: un mapa de los terremotos de 7,0 magnitud o más desde el 1 de enero del 2000.

Zoho Reports

Lo que hace: Zoho Reports puede tomar datos de varios formatos de archivo o directamente desde una base de datos y convertirlos en gráficos, tablas y tablas dinámicas, formatos familiares para la mayoría de los usuarios de hojas de cálculo.

Lo que es genial: Puede programar importaciones de datos desde fuentes en la Web. Los datos se pueden consultar usando SQL y se pueden convertir en visualizaciones, y el servicio está configurado para publicar y compartir en la Web (aunque si hay más de dos usuarios, se necesita una cuenta de pago).

Zoho Reports proporciona gráficos y tablas de negocio tradicionales.
Zoho Reports

Inconvenientes: Las opciones de visualización son bastante básicas y limitadas. Interactuar en vivo con los datos basados en la web puede ser lento a veces. Los archivos de datos están limitados a 100 mil filas en la versión gratuita. A veces me pareció que la navegación se hacía confusa.

Nivel de habilidad: Principiante avanzado.

Se ejecuta en: Cualquier navegador web.

Más información: Hay demostraciones de video, y muestras, en el sitio web de Zoho.

AYUDA DE CÓDIGO: ASISTENTES, BIBLIOTECAS, APIS

A veces nada puede sustituir a la codificación de su propia visualización -especialmente si el aspecto y la sensación que está buscando no se puede lograr sin una aplicación de escritorio o web existente. Pero eso no significa que necesite empezar desde cero, gracias a una amplia gama de bibliotecas y APIs disponibles.

Documentos basados en datos (D3, por sus siglas en inglés).
D3.js
D3.js

Lo que hace: Una de las bibliotecas de JavaScript más populares para crear visualizaciones web, D3.js "combina potentes componentes de visualización y un enfoque basado en datos para la manipulación de DOM [Web document]", según el sitio web del proyecto.

D3.js le permite crear visualizaciones basadas en datos en una página web, lo que permite que los diseñadores creen una amplia gama de visualizaciones interactivas.

Lo que es genial: Si puede imaginarlo, lo más probable es que pueda implementarlo en D3.js. Un viejo dicho del New York Times: comparando las ofertas de acciones iniciales de Facebook con otras IPOs de tecnología.

Inconvenientes: Ésta no es una habilidad trivial para aprender. Necesitará una cantidad justa de conocimiento sobre esta biblioteca de JavaScript y tecnologías web en general para hacer cualquier cosa. Para dataviz básico, esto será mucho trabajo para los no iniciados.

Nivel de habilidad: Experto.

Se ejecuta en: La mayoría de los navegadores modernos.

Más información: Consulte la página de tutoriales D3, incluyendo enlaces a algunos tutoriales útiles para principiantes por Scott Murray.

Exhibit

Lo que hace: Este spin-off del Proyecto MIT Simile está diseñado para ayudar a que los usuarios "creen fácilmente páginas web con el texto de búsqueda y funcionalidades de filtrado avanzado, con mapas interactivos, líneas de tiempo y otra visualización". Catalogado como un marco de publicación, la biblioteca de JavaScript permite añadir fácilmente filtros, búsquedas y mucho más. La página de visualización fácil de datos para periodistas ofrece ejemplos de código en uso en una serie de sitios web de periódicos.

"Fácil" está en el ojo del espectador -lo que es fácil para los profesionales del MIT que crearon Exhibit podría no ser tan sencillo para un usuario cuyo nivel de confort se detiene en Excel. Al igual que la mayoría de las bibliotecas JavaScript, Exhibit requiere más codificación manual que servicios como Google Fusion Tables. Por otro lado, Exhibit tiene documentación clara para principiantes, incluso para aquellos que no tienen experiencia JavaScript.

Lo que es genial: Para aquellos que se sienten cómodos con la codificación, Exhibit ofrece una serie de vistas -mapas, gráficos, gráficos de tiempo, calendarios y más-, así como lentes personalizados (formas de dar formato a un registro individual) y facetas (propiedades que se pueden buscar o clasificar). Es posible que tenga más probabilidades de obtener la presentación exacta que desea con Exhibit que con un servicio web de personalización limitada. Y sus datos permanecen locales a menos que decida publicarlos.

Inconvenientes: Para los recién llegados que no estén acostumbrados a las visualizaciones de codificación, toma tiempo familiarizarse con la codificación y la sintaxis de la biblioteca.

Nivel de habilidad: Experto

Obtenga más información: Hay varios ejemplos que puede consultar, incluyendo ciudades de EE.UU. por población y otros.

Google Chart Tools

Lo que hace: A diferencia de Google Fusion Tables, que es una aplicación completa y autónoma para almacenar datos y generar gráficos y mapas, Chart Tools está diseñada para visualizar datos que residen en otro lugar, como su propio sitio web o Google Docs.

Google Chart Tools ofrece un asistente y una API para crear gráficos Web a partir de datos.
Google Chart Tools

La API de Chart Tools accede a una biblioteca de JavaScript de Google para crear gráficos interactivos. (Nota: Google concluyó su apoyo a la creación de gráficos estáticos de imagen. La API de herramientas de gráfico no se ve afectada.)

La API de visualización incluye varios tipos de gráficos, mapas, tablas y otras opciones.

Lo que es genial: La API le permite extraer datos desde una hoja de cálculo de Google. Puede crear íconos que mezclen texto e imágenes para visualizaciones, como esta nota de previsión del tiempo y lo que llama un gráfico "Google-o-meter. La API de visualización también tiene algo de la mejor documentación que he visto para una biblioteca de JavaScript.

Inconvenientes: La API, al igual que con otras bibliotecas JavaScript, requiere codificación, convirtiéndola en una herramienta de programación más que en una aplicación de inteligencia empresarial de usuario final. Pero a diferencia de la mayoría de las bibliotecas de JavaScript, no tiene acceso al código subyacente y tienes que depender de Google para seguir apoyando la plataforma.

Nivel de habilidad: Principiante avanzado a experto

Se ejecuta en: Cualquier navegador web

Más información: Consulte la Guía rápida. También hay muestras en la Galería de APIs de visualización de Google.

Esta muestra de directorios muestra algunas de las capacidades de visualización de InfoVis JavaScript Toolkit. Puede ver una versión interactiva más grande en el sitio web de InfoVis.
JavaScript InfoVis Toolkit
JavaScript InfoVis Toolkit

Lo que hace: InfoVis probablemente no está entre las bibliotecas de visualización de JavaScript más conocidas, pero podría valer la pena si está interesado en publicar visualizaciones interactivas de datos en la web.

Lo que diferencia a esta herramienta de muchas otras son los gráficos altamente pulidos que crea a partir de muestras de código básico. El creador de InfoVis, Nicolas García Belmonte, arquitecto senior de software de Sencha Inc., claramente se preocupa tanto por el diseño estético como por el código.

Lo que es genial: Las muestras son magníficas, y no hay codificación adicional involucrada para obtener efectos voladores. Puede elegir descargar el código solo para los tipos de visualización que desea utilizar para minimizar el peso de las páginas web.

Inconvenientes: Dado que no se trata de una aplicación, sino de una biblioteca de códigos, debe tener conocimientos de codificación para poder utilizarlo. Por lo tanto, esto podría no ser un buen ajuste para los usuarios que analizan datos, pero no saben cómo programar. Además, la elección de los tipos de visualización es algo limitada. Y parece que el código no se ha actualizado durante varios años.

Nivel de habilidad: Experto.

Se ejecuta en: Navegadores web habilitados para JavaScript.

Más información: Vea demos con código fuente.

GIS/CARTOGRAFÍA EN EL ESCRITORIO

Hay una amplia gama de usos empresariales para sistemas de información geográfica (GIS, por sus siglas en inglés), que van desde la exploración de petróleo hasta la elección de sitios para nuevas tiendas minoristas. O, como The Miami Herald hizo para su cobertura ganadora del Premio Pulitzer del huracán Andrew, puede comparar velocidades máximas de viento con reportes de daños e información de construcción (y tal vez descubra, por ejemplo, que el peor daño no ocurrió en las áreas que sufren Los vientos más fuertes, sino en las zonas con gran cantidad de construcciones nuevas y de mala calidad).

Quantum GIS (QGIS)

Lo que hace: Este es un software GIS completo, diseñado para crear mapas que ofrecen un análisis sofisticado, detallado y basado en datos de regiones geográficas.

El software más conocido de GIS de escritorio probablemente sea el de Esri, ArcGIS una aplicación robusta bien soportada que cuesta algo de dinero. El QGIS de código abierto es una alternativa.

Quantum GIS (QGIS) ofrece una completa visualización geoespacial y análisis en el escritorio.
Quantum GIS (QGIS)

Como OpenOffice es para Microsoft Office, QGIS es para ArcGIS. Los entusiastas de ArcGIS sostienen que la oferta de Esri está un par de iteraciones por delante de las alternativas de código abierto, tiene una interfaz mejor desarrollada, disfruta de soporte comercial, y es más adecuada para la impresión. Pero los usuarios de QGIS dicen que la alternativa de código abierto es un excelente programa que hace mucho trabajo útil SIG -y ahora hay una empresa llamada Boundless que tiene como objetivo ofrecer (pagar) apoyo a las empresas.

Lo bueno: QGIS tiene una enorme cantidad de funcionalidad SIG, incluyendo la capacidad de crear mapas, superponer varios tipos de datos, hacer análisis espacial, publicar en la web y más. También se puede mejorar con los plug-ins que añaden soporte para numerosas empresas, incluidas las de geocodificación, la gestión de datos de las tablas subyacentes, poder exportar a MySQL y la generación de mapas de imagen HTML.

Desventajas: Al igual que con cualquier aplicación SIG sofisticada, aprender a usar este software implica un serio ejercicio de tiempo y entrenamiento. Incluso en sesiones prácticas de una hora de duración con ArcGIS primero y luego con QGIS, me di cuenta de cosas que eran más fáciles de hacer en la opción comercial, tales como algunos campos calculados.

Se ejecuta en Linux, Unix, MacOS X, Windows. (Este es un caso en que la instalación es más complicada en OS X, ya que requiere instalación manual de varias dependencias. Hay un instalador de un solo clic para Windows.)

Nivel de habilidad: Intermedio a expertos.

Más información: Timothy Barmann de The Providence Journal publicó dos clases particulares muy útiles para la conferencia CAR que aún están disponibles: Introducción a QGIS y lo último en la cartografía con JavaScript y jQuery. Otro recurso para ayudarle a empezar: QGIS Tutorial Labs, de Richard E. Plant, profesor emérito de la Universidad de California, Davis.

Nota: Si está interesado en SIG y desea considerar otras opciones de software, descargue este listado PDF de productos GIS de código abierto/no comerciales. Y si está buscando un programa de SIG de escritorio libre de código abierto que sea bastante fácil de usar, Jacob Fenton, director de periodismo asistido por computadora en el taller de periodismo de investigación de la American University, recomienda echar un vistazo al sitio Sistema Automático de análisis Geocientíficos (SAGA, por sus siglas en inglés). Por último, si el análisis de datos geográficos en una base de datos convencional suena interesante, PostGIS "permite especialmente" la base de datos relacional PostgreSQL.

GIS/CARTOGRAFÍA BASADA EN LA WEB

La mayoría de nosotros estamos familiarizados con las herramientas cartográficas o de mapeo de grandes empresas como Google (que tiene una serie de front-ends de terceros, tales como Map A List, un complemento que añade información a un mapa Google de una hoja de cálculo). También hay mapas de Bing con una API. Pero hay otras opciones de las organizaciones más pequeñas o entusiastas de código abierto que fueron diseñadas desde cero para mapear los datos geográficos.

OpenLayers

Lo que hace: OpenLayers es una librería JavaScript para la visualización de la información del mapa. Está dirigido a proporcionar una funcionalidad similar a las bibliotecas de código de las grandes compañías -pero con código de fuente abierta. OpenLayers trabaja con OpenStreetMap y otros mapas.

Otros proyectos se acumulan en él para agregar funcionalidad o facilidad de uso, tales como GeoExt, lo que añade más capacidades de GIS. Para los usuarios que se sienten cómodos codificando JavaScript manualmente y prefieren no usar una plataforma comercial, tales como Google o Bing, ésta puede ser una opción atractiva.

Inconvenientes: OpenLayers no es tan fácil de usar como, por ejemplo, Google Maps.

Nivel de habilidad: Experto.

Se ejecuta en: Cualquier navegador web.

Más información: Pruebe este inicio rápido de OpenLayers.

OpenStreetMap

Lo que hace: OpenStreetMap es algo así como la Wikipedia del mundo de la cartografía, con varias características, tales como carreteras y edificios aportados por los usuarios de todo el mundo.

Lo bueno: El principal atractivo de OpenStreetMap es su naturaleza de comunidad, lo que ha llevado a una serie de usos interesantes. Por ejemplo, es compatible con Ushahidi, plataforma móvil utilizada para recopilar información después de desastres tales como terremotos. (Aunque Ushahidi puede usar varios proveedores diferentes para la capa de mapa base, como Google y Yahoo, algunos creadores de proyectos se sienten más cómodos con una opción de código abierto).

Desventajas: Al igual que con cualquier proyecto que acepta la opinión del público, puede haber problemas con los contribuyentes (como el helipuerto que colocaron una vez en mi barrio -que en realidad está a varios kilómetros de distancia). Aunque, para ser justos, he encontrado a más de una empresa en Google Maps que estaba fuera de fecha. Además, el aspecto general y la sensación de los mapas no es tan fina como algunas alternativas comerciales.

Nivel de habilidad: Principiante a intermedio avanzado.

Se ejecuta en: Cualquier navegador web.

Más información: Vea el tutorial rápido en el sitio OpenLayers.

ANÁLISIS TEMPORAL DE DATOS

Si el tiempo es un componente importante de sus datos, las visualizaciones de línea de tiempo tradicionales pueden mostrar patrones, pero no permiten un análisis sofisticado o una gran cantidad de interacción. Ahí es donde entra en juego este proyecto.

TimeFlow

Lo que hace: Este es el software de escritorio para el análisis de los puntos de datos que implican un componente de tiempo. En una demostración que escribí antes de su lanzamiento, los creadores Fernanda Viégas y Martin Wattenberg -el par detrás proyecto pionero Many Eyes de IBM que más tarde se fue a Google- mostraron como TimeFlow puede generar líneas de tiempo visuales de archivos de texto, con entradas por colores y tamaño -codificadas para facilitar la localización de patrones. También permite que la información se clasifique y se filtre, y da algunos resúmenes estadísticos de los datos.

TimeFlow ofrece varias formas de visualizar fácilmente los datos con un componente de tiempo importante.
TimeFlow

Lo bueno: TimeFlow hace que sea fácil interactuar con los datos de varias maneras, tales como cambiar de vista o filtrado por criterios tales como rangos de fechas o terremotos de magnitud 8 o más. La vista de línea de tiempo ofrece un control deslizante para que pueda concentrarse en un período de tiempo. Mientras que muchas aplicaciones pueden trazar gráficos de barras, algunas también ofrecen vistas del calendario. Y a diferencia de Google Fusion Tables basado en web, TimeFlow es una aplicación de escritorio que hace que editar las entradas individuales sea rápido y simple.

Inconvenientes: No hay instalaciones para editoriales o para compartir resultados aparte de una captura de la pantalla, y el código no se ha actualizado en varios años.

Nivel de habilidad: Principiante.

Se ejecuta en: Los sistemas de escritorio ejecutan Java, incluyendo Windows y MacOS X.

Más información: Revise los mejores consejos.

Nota: Si está buscando publicar calendarios visualizados, las mejores opciones incluyen Google Fusion Tables, VIDI o el widget SIMILE Timeline.

NUBES DE TEXTO/PALABRAS

Una gran cantidad de expertos de DataViz no tienen en cuenta la nube de palabras, considerándola poco seria y original. Se puede pensar en ellos como el tiramisú de las visualizaciones -hace mucho tiempo de moda, ahora usado en exceso. Sin embargo, algunos todavía disfrutan de estos gráficos que muestran cada palabra de un archivo de texto una vez, con el tamaño variante de las palabras dependiendo de la frecuencia con que aparecen en la fuente.

Generador de nube de palabras de IBM

Lo que hace: Varias herramientas mencionadas anteriormente pueden crear nubes de palabras, incluyendo Many Eyes y la API de visualización de Google, así como la página web de Wordle (que es una herramienta útil para la toma de nubes de palabras de las páginas web en lugar de archivos de texto). Pero si está buscando un software de escritorio fácil dedicado a la tarea, la aplicación de escritorio Word-Cloud de IBM encaja a la perfección.

Lo bueno: Es una manera rápida y fácil de encontrar la frecuencia de palabras en el texto.

Inconvenientes: Debido a que está tratando de ignorar palabras tales como "a" y "el", la configuración básica puede pasar por alto algunos términos importantes. En las primeras pruebas, no reconocía la diferencia entre "it" e "IT", y dejó pasar "AT & T".

Nivel de habilidad: Principiante avanzado. Esta aplicación se ejecuta en la línea de comandos, por lo que los usuarios deben tener la capacidad de encontrar rutas de archivos y conectarlos a un comando de ejemplo.

Se ejecuta en: Windows, MacOS X y Linux que ejecute Java.

Más información: Compruebe los ejemplos que vienen con la descarga.

ANÁLISIS DE REDES SOCIALES Y OTRAS

Estas herramientas utilizan una definición pre-Facebook/Twitter de "análisis de redes sociales" (SNA, por sus siglas en inglés), en referencia a la disciplina de la búsqueda de conexiones entre las personas sobre la base de varios conjuntos de datos. Los periodistas de investigación han utilizado estas herramientas para, por ejemplo, encontrar vínculos entre las personas que están involucradas en proyectos de desarrollo, o que son miembros de varios consejos de administración.

Es necesario un entendimiento de las teorías estadísticas de análisis de nodo de red con el fin de utilizar esta categoría de software. Dado que solo he tenido una introducción muy básica a esta disciplina, esta es una categoría de herramientas que no probé. Pero si está buscando software para hacer este tipo de análisis, uno de ellos podría satisfacer sus necesidades.

Gephi

Lo que hace: Promocionado como un Photoshop para los datos, este proyecto beta de código abierto está diseñado para la visualización de la información estadística, incluyendo las relaciones dentro de las redes de hasta 50 mil nodos y medio millón de bordes (conexiones o relaciones), así como los análisis de red de factores tales como "intermediación" cercanía y coeficiente de agrupamiento.

Gephi puede visualizar redes de hasta 50 mil nodos.
Gephi

Se ejecuta en: Windows, Linux, Mac OS X corriendo Java 1.6.

Más información: Pruebe este tutorial de inicio rápido.

NodeXL

Lo que hace: Este plug-in de Excel muestra gráficos de red a partir de una lista dada de conexiones, lo que ayuda a analizar y ver patrones y relaciones en los datos.

NodeXL fusiona las definiciones más antiguas y actuales del SNA. Se trata de "optimizado para el análisis de los medios sociales en línea -que incluye conexiones integradas para consultar las API de Twitter, Flickr y YouTube, permitiéndole dibujar las redes de usuarios y su actividad", según Peter Aldhous, jefe de la oficina de San Francisco a la revista New Scientist Magazine.

También se ocupa de archivos de análisis de redes convencionales (incluyendo los datos creados por la popular -pero no libre- herramienta de análisis de correo electrónico UCINET).

Se ejecuta en: Excel en Windows.

Más información: Descargue este tutorial NodeXL (PDF) por el periodista científico Peter Aldhous.