Llegamos a ustedes gracias a:



Reportajes y análisis

Visualización de datos con Microsoft Power BI

Su guía paso a paso

[01/08/2016] Microsoft ha saltado al espacio de autoservicio gratuito de análisis de datos con Power BI.

Power BI ofrece capacidades básicas de disputas de datos similares a los de Power Query de Excel. También permite crear visualizaciones interactivas, informes y cuadros de mando con unos pocos clics o arrastrando y dejando caer; escriba preguntas en lenguaje natural sobre sus datos en un tablero de instrumentos; y maneje los archivos que son demasiado grandes para Excel.

Puede trabajar con docenas de tipos de datos -no solo Excel, Access y archivos CSV, sino también con Salesforce, Google Analytics, MailChimp, GitHub, QuickBooks Online y docenas de otros. Y ejecutará secuencias de comandos R -lo que significa que todos los datos que pueda tirar adentro y que pasen por R se pueden importar en Power BI.

Revise también como parte de este tutorial lo siguiente:

¿Qué es exactamente Power BI?

Power BI incluye tanto un programa de escritorio descargable y un servicio de nube, cada uno de los cuales ofrece capacidades diferentes pero que se superponen. La disputa o wrangling de datos es solo para el escritorio; las visualizaciones y los informes se pueden crear en cualquiera de los dos; los cuadros de mando e informes compartidos son solo para la nube. Además, hay aplicaciones móviles para iOS, Android y Windows que le permiten ver sus informes y tableros de control Power BI o SQL Server Reporting Services (SSRS).

Al menos por ahora, puede tomar ventaja de la mayoría de las capacidades de Power BI sin pagar -aunque Microsoft está apostando claramente a que le gustarán los servicios básicos de nube lo suficiente para saltar a una cuenta de pago a 9,99 dólares mensuales. Los principales beneficios de la cuenta de pago es que se incrementa el almacenamiento de datos (10GB frente a 1GB), actualizaciones de datos más oportunas y automatizadas, la capacidad de crear "paquetes de contenido" de la empresa y mayor capacidad de streaming.

Tenga en cuenta, sin embargo, que Microsoft solicita una dirección de correo electrónico de negocios cuando se suscribe a servicios en la nube de Power BI -aunque no puede descartar a todas las direcciones no comerciales, no aceptará direcciones conocidas de consumo como Gmail.com. Las cuentas con direcciones .gov y .mil tampoco son compatibles con la inscripción directa en powerbi.com, aunque las direcciones .edu y .org sí.

Y si desea utilizar cualquiera de las aplicaciones móviles gratuitas de Power BI, necesitará una cuenta de nube Power BI o acceso a SQL Server de su organización.

Por otro lado, Power BI de escritorio (al menos por ahora) no solo es libre, sino que no requiere una cuenta, una dirección de correo electrónico o una tarjeta de crédito -tan solo una PC con Windows.

Si desea aprender a utilizar esta herramienta nueva para crear informes y cuadros de mando, que todavía está en evolución, siga leyendo.

Importar datos en Power BI

Power BI Desktop o de escritorio es el mejor lugar para empezar, a menos que esté seguro de que sus datos ya están en el formato que necesita para su visualización. (Que puede ser el caso si, como yo, prefiere hacer el wrangling de sus datos con un lenguaje de scripting como R o Python).

Si está acostumbrado a Excel, podría pensar que seleccionar Archivo > Abrires la manera de comenzar a analizar sus datos en Power BI. Pero podría estar equivocado -Archivo > Abrires solo para un proyecto existente de Power BI.

En cambio, para importar nuevos datos, haga clic en el botón Obtener datosde la pestaña Inicio, seleccione el tipo de fuente de datos y haga clic en Conectar.

Para cargar un archivo, vaya a Obtener datos y seleccione el tipo de datos.
Microsoft Power BI

Con ello se abrirá un diálogo de selección de archivos de Windows. Elija su archivo y verá una vista previa de los datos. Si se ve bien y no hay nada más que quiera hacer con los datos antes de empezar a graficar y clasificar, presione Cargar. De lo contrario, haga clic en Editar, lo cual mostrará el Query Editor de Power BI.

En este artículo, vamos a utilizar los archivos mensuales de información de retrasos de vuelos de avión a partir del verano pasado que he descargado de la página de la Administración Federal de Aviación (FAA, por sus siglas en inglés). Yo sé -especialmente cuando se trata de líneas aéreas, el rendimiento pasado no es garantía de resultados futuros. Pero si va a reservar un vuelo en estos días, podría ser divertido (aunque no necesariamente predictivo) responder a preguntas tales como: ¿Qué aerolíneas tuvieron los peores retrasos el verano pasado? ¿Hay algún vuelo específico que lo hace especialmente bien o mal? Estas tablas de Power BI, pueden ayudarle a responder estas preguntas con facilidad.

Si quiere ir más allá, puede descargar sus propios archivos de datos de la web del Departamento de Transporte. O si lo desea, puede descargar los mismos archivos que estoy usando aquí -el archivo de descarga, está disponible para todos los miembros del programa Computerworld Insider; la inscripción es gratuita, por lo que si no es un Insider, es bastante fácil para inscribirse. Los archivos incluyen datos de vuelos domésticos en los EE.UU. por mes (por lo que, si desea comprobar vuelos a París, esto no ayudará). Hay archivos separados para junio, julio, agosto y septiembre.

Comience por cargar en el archivo de junio (2015_06_ONTIME.csv): Vaya a Obtener datos > CSV en Power BI. Seleccione y abra su archivo, y verá una vista previa de los datos. A continuación, haga clic en Editar(no en Cargar) para abrir el Editor de consultas. Ahora podemos hacer algo de wrangling de datos.

Una cosa que puede ser útil de comprobar en este punto es si las columnas de números se cargan de forma numérica (alineadas a la derecha) o como texto (alineadas a la izquierda). En otras palabras, si ve que los números están alineados a la izquierda en la vista previa de los datos, no están importando correctamente -es una de las razones para elegir Editary abrir la ventana del Query Editor, incluso si no cree necesario hacer cambios en la estructura de sus datos.

Asegúrese de que las columnas de números se carguen como numéricos -en otras palabras, alineados a la derecha.
Microsoft Power BI

Una vez que está en el Query Editor, puede hacer clic en un encabezado de columna y seleccionar "Cambiar tipo" con el fin de seleccionar manualmente un tipo de datos tales como número entero, número decimal, fecha, fecha/hora, etc. Pero hay mucho más que puede hacer con estos datos, además de comprobar los tipos de columnas.

Una vez en el Query Editor, puede empezar a ajustar sus datos.
Microsoft Power BI

Nota: Si no está interesado en el wrangling de los datos y quiere empezar a trabajar con tablas y gráficos, cargue el archivo summer15delays.csvy pase directamente a la sección de visualización fácil -pero asegúrese de que el número de vuelo haya cambiado de numérico a texto al importar el archivo.

Wrangling de datos

El Query Editor le permite remodelar y transformar los datos, por ejemplo, fusionando múltiples fuentes de datos o dejando de hacerlos girar. También puede manejar la monotonía común referente a los datos, como añadir, borrar, cambiar el nombre y mover columnas.

Para los datos de retraso de vuelos, deberá combinar varios meses en una sola tabla, así que no empiece a cambiar los datos dentro de junio hasta que haya agregado julio, agosto y septiembre. De lo contrario, habría que repetir las mismas transformaciones en cada archivo antes de combinarlos.

Para importar más archivos CSV en esta ventana activa del Query Editor, haga clic en Nuevo origen > CSV,y seleccione un archivo (puede seleccionar solo uno a la vez), dele una vista previa rápida a los datos y haga clic en Aceptar.

Cada fuente de datos debería aparecer ahora en Consultasen el panel izquierdo. A continuación, en el panel de Consultas, haga clic en la tabla a la que desea agregarle datos (para este ejemplo, puede elegir 2015_06_ONTIMEy añadir otros meses para eso).

Haga clic en Anexar consultas(si la ventana del navegador es estrecha, anexar las consultas puede estar debajo del botón Combinar), haga clic en tres o más tablas (el valor predeterminado es dos) y siga las instrucciones del cuadro de diálogo.

Anexar las consultas le permite combinar las fuentes de datos.
Power BI

Su archivo 2015_06_ONTIMEdebe tener ahora cuatro meses de datos, no solo de junio por lo que probablemente valga la pena cambiarle el nombre a algo así como 2015_SUMMER_ONTIME. Puede hacer clic en el panel de consultas de la izquierda para cambiar su nombre; o, con la consulta activa (hacer clic en el panel de consultas), ver la configuración de la consulta en el panel de la derecha y cambiar el texto en el cuadro Nombre, en PROPIEDADES.

A continuación, trataremos de unir dos tablas usando una columna común -lo que a menudo se llama una combinación en SQL o usando una tabla de consulta en Excel.

La columna TRANSPORTISTAen 2015_06_ONTIMEutiliza códigos de las aerolíneas (tales como AA) en lugar de los nombres de las aerolíneas. Sería bueno tener disponibles los nombres completos de las aerolíneas ya que no todos los códigos son intuitivos -AA puede ser obvio, pero VX y B6 no tanto. He creado un archivo de códigos de las aerolíneas y los nombres de soporte, airlinecodes.csv, que también está disponible en los datos para descargar de Computerworld Insider. Puede importar el archivo a la ventana actual del Query Editor mediante el botón Nuevo origen.

En mi sistema, airlinecodes.csv fue importado en Power BI sin los nombres correctos de las columnas. En cambio, las columnas fueron nombradas "Columna1" y (obviamente los valores predeterminados del sistema) "Columna2", mientras que los nombres de las columnas reales, "Código" y "Línea aérea", aparecieron como la primera fila de datos. Si eso le sucede también, mirar a la derecha en la cinta Hogary debería ver una opción para utilizar la primera fila como encabezado. Haga clic para solucionarlo.

A continuación, añadiremos información de nombre de la aerolínea para los datos de vuelo retrasados. Con su fuente principal de datos activa, 2015_SUMMER_ONTIME, seleccione Combinar consultas. En el cuadro de diálogo que aparece, seleccione la tabla de consulta con información de búsqueda, en este caso códigos de las aerolíneas, y luego haga clic en el encabezado de la columna para la columna común de cada tabla: PORTADORen 2015_SUMMER_ONTIMEy códigoen la tabla de códigos de las aerolíneas.

Por último, elija qué tipo de fusión/unión desea -están descritos en la lista desplegable. Por ejemplo, la que queremos, "Izquierda exterior", significa "Mantener todas las filas de la primera tabla así coincida o no en la segunda tabla". Power BI ahora intentará estimar cuántas filas coinciden, lo cual es útil si ha cometido un error y termina con cero coincidencias, y por lo tanto necesita volver a examinar las columnas que está utilizando y si los datos se formatean del mismo modo en ambos.

¿Todo bien? Haga clic en OK y la unión se hace.

Después de la fusión, verá una columna en el extremo derecho de la tabla de datos con la etiqueta NewColumn, con un ícono de tabla a la izquierda del nombre de la columna y las flechas hacia la derecha. Haga clic en las flechas para ampliar esa columna de la tabla para ver los datos -puede elegir las columnas que desea agregar a la tabla original.

Amplíe la columna de la tabla para ver los datos.
Microsoft Power BI

Si desea mover la columna Aerolíneamás cerca de Transportista, vaya a la pestaña Transformar. Allí tiene la opción de mover la nueva (o cualquier otra) columna. En este caso, utilizando la interfaz de Power BI, puede seleccionar la nueva columna y luego usar Mover > Al inicio y luego Mover > Derecha cuatro veces con el fin de tener la columna de la aerolínea junto a la columna del transportista. Pero hay una manera menos engorrosa.

La cinta Transformar tiene una serie de opciones que incluyen mover una columna.
Microsoft Power BI

En primer lugar, si no ve una barra de fórmulas arriba de la tabla, vaya a la cinta Very compruebe que la Barra de fórmulasesté habilitada para ser visible. Luego vaya a la cinta Transformar, asegúrese de que la columna de la aerolínea se haya seleccionado, y elija Mover > Al inicio. Ahora verá una fórmula en el lenguaje M que reordenará las columnas. Haga clic en Mover > derecha y verá cómo cambia la fórmula. Parece como si sólo pudiera cortar y pegar la columna de Aerolínea en donde desee que vaya -pero no se pueden hacer cambios aquí.

Compruebe la barra de Fórmula bajo la cinta de Vista con el fin de ver las secuencias subyacentes de comandos de idioma M.
Microsoft Power BI

En su lugar, vaya a Ver > Editor avanzadoy verá todos sus pasos como un guion. Editar la línea Table.ReorderColumns poner Aerolínea cuando lo desee, y haga clic en Hecho. Su columna Aerolínea debería haberse movido.

Edite la línea Table.ReorderColumns para poner Aerolínea cuando lo desee.
Microsoft Power BI

También hay una serie de otras operaciones disponibles en el menú Transformar, como la agrupación de valores de una o más columnas, las columnas de división sobre la base de un separador o el número específico de caracteres, y pivotante (similar a la creación de tablas dinámicas de Excel) o 'unpivoting' (mover varias columnas de datos en dos columnas: datos variables, tales como "Mes", y datos de valor como "junio").

También puede hacer un poco de exploración estadística básica utilizando las opciones de la cinta de Transformación, como contar las filas o la creación de estadísticas de resumen como el recuento, la media, la mediana y la desviación estándar. Cuando se realiza un resumen de datos, aparecerá una tabla con los nuevos valores que se resumen en lugar de la tabla de datos original. Para obtener la vista de sus datos originales de nuevo, vaya a la columna Pasos Aplicados a la derecha de la tabla de datos y elimine la función de resumir.

De hecho, puede utilizar Pasos Aplicadospara eliminar cualquier paso que haya dado aquí, no solo el más reciente, que es bastante útil. Por desgracia, no hay una forma de Deshacer después de eliminar un paso en el Query Editor, por lo que no puede volver a algo que ya ha borrado.

Seleccione el menú 'Contar filas'en la cinta Transformarpara ver el número de filas; si está utilizando archivos de retrasos de vuelo descargados de Computerworld, verá que hay un poco más de dos millones de filas -más de lo que podría ver en Excel y su límite de 1.048.576 filas. Elimine el paso 'Contar filas' para volver a los datos completos.

En este momento hay más de 50 columnas en la tabla de vuelos retrasados del verano. Para hacer las cosas más manejables, seleccione solo algunas que desee visualizar: MES, Fecha de vuelo, línea aérea, NUM de vuelo, ORIGEN, Ciudad de origen, DEST, Ciudad de destino, Hora de partida, Partida con demora, Llegada con demora, CANCELADO, Retraso de la transportadora, Retraso por clima, Retraso por seguridad, Retraso por NAS, Retraso por fuselaje del avión.

Haga clic en el botón Columnasen la cinta Inicioo Home, deseleccione 'Seleccionar todas las columnas' y luego seleccione las casillas junto a las columnas que desea conservar y haga clic en OK.

Si más adelante decide que desea volver a añadir cualquier columna, puede volver al Query Editor haciendo clic en 'Editar consultas'y haciendo clic en la configuración de ajustes junto a 'Remover otras columnas' en la columna 'Pasos Aplicados'. Eso trae de vuelta sus selecciones previas en el cuadro de diálogo, y puede añadir más columnas a su proyecto.

Por último, asegúrese de cambiar las columnas que no tienen sentido como números en texto. Por ejemplo, a menos que quiera que Power BI calcule las sumas de sus números de vuelo -y usted no- conviértalos en texto. De lo contrario, el intento de hacer gráficos con estos campos como categorías no funcionará, y terminará perdiendo una buena cantidad de tiempo (no me pregunte cómo lo sé). Puede convertir Número de vuelo y MES en texto, haga clic en el encabezado de la columna y elija Cambiar tipo > Texto. Otro truco: La columna CANCELADA muestra 0 para falso y 1 para cierto -si lo desea, puede cambiarla a Verdadero/Falso.

Ahora viene la parte divertida.

Visualizaciones fáciles

Cierre el Query Editorcon 'Cerrar y aplicar' para volver a la aplicación principal de Power BI. (Debido a que estos archivos son tan grandes, esto puede tomar un poco de tiempo.) En este punto, también puede que quiera ejecutar Archivo > Guardarpara guardar su trabajo como un proyecto de Power BI por si algo sucede y no tener que volver a crear pasos.

Su lienzo en blanco de Power BI debe ser algo como esto:

Un lienzo en blanco de Power BI.
Microsoft Power BI

Sería bueno deshacerse de todos los demás archivos de consulta que se fusionaron en 2015_VERANO_ATIEMPO, ya que no los utilizará de nuevo. Si va al panel 'Campos' a la derecha y trata de apretar el botón derecho del mouse y seleccionar 'Eliminar', obtendrá una advertencia de que no se pueden eliminar esas consultas porque están referenciadas por otra consulta. Sin embargo, puede hacer clic derecho y luego "esconderlos para sacarlos del camino.

haga eso con todas las consultas excepto 2015_VERANO_ATIEMPO. Ahora que solo queda una tabla de consulta, 2015_VERANO_ATIEMPOse expandirá automáticamente para mostrar sus nombres de columna. (Cuando hay varias consultas en el menú, los nombres de columna no aparecen por defecto, haga clic en el triángulo junto a uno para expandirlo, haga clic derecho y elija 'Expandir todo' para ver todos los campos de las consultas.)

¿Desea representar gráficamente demoras en las salidas? Haga clic en la casilla de verificación junto a DEP_DELAY. Y obtendrá un gráfico con una barra que suma todo el tiempo de retardo en los datos. (Power BI trata de adivinar qué visualización funciona mejor con sus datos si no lo especifica.) Haga clic en 'Aerolínea', y se transformará en un gráfico de barras con el total de retrasos de vuelo de cada aerolínea.

Una suma de los retrasos totales por línea aérea no es tan útil, sin embargo; a mayor cantidad de vuelos por línea aérea, es probable que tenga más minutos de retraso. Pero si mira bajo el panel de visualización y encuentra DEP_DELAY bajo 'Valor', puede hacer clic en el menú desplegable y cambiar la suma de minutos de DEP_DELAYa 'Media' (o mediana, si lo prefiere).

Al hacer clic en el triángulo situado junto a un campo 'Valor' aparecen opciones de visualización, como el cambio de Suma a media.
Microsoft Power BI

(Si el gráfico es demasiado pequeño, simplemente haga clic y arrastre una esquina de la caja para cambiar su tamaño.)

El gráfico se ordena alfabéticamente por aerolínea. Si quiere que esté ordenado de mayor a menor, haga clic en los puntos suspensivos en la parte superior derecha y elija Ordenar por > Promedio de DEP_DELAY.

Al hacer clic en los puntos suspensivos en la parte superior derecha de un gráfico aparecen opciones de clasificación.
Microsoft Power BI

Los retrasos en las llegadas también serían interesantes. Arrastre ARR_DELAY en el área 'Valor' del panel y cambiarlo de 'Suma' a 'Media'. Haga clic en los puntos suspensivos de nuevo en la parte superior derecha para ordenar ARR_DELAYde forma descendente (si el valor predeterminado es ascendente, basta con hacer clic de nuevo). Ahora debería tener un gráfico que tiene este aspecto:

Un gráfico que muestra los retrasos de salida y llegada.
Microsoft Power BI

(Se puede ver una versión de la gráfica que ocupa todo el lienzo haciendo clic en el ícono "Modo de enfoque" al lado de la elipse en la parte superior derecha de las fronteras de la gráfica.)

El título predeterminado es poco convincente. Puede cambiar el título y una gran cantidad de valores por defecto haciendo clic en el ícono de pincel justo debajo de las opciones de visualización. Para editar un gráfico específico, asegúrese de hacer clic en él, para que esté activo (el cuadro delimitador es visible). Haga clic en el título y verá opciones para cambiar el texto del título, color de fuente, tamaño, alineación y así sucesivamente.

También hay opciones para añadir etiquetas de datos a las barras, cambiar los ejes X e Y, y mucho más.

Por ejemplo, puede cambiar el título a 'Salidas promedio y Demora en las llegadas en minutos, Jun - Sept 2015', subir el tamaño del texto y centrarlo. Si desea cambiar el nombre de los campos, puede hacerlo en el panel 'Campos' -haga clic en un campo y elija cambiar el nombre. Intente cambiar DEP_DELAYa Dep Delay y ARR_DELAYa Arr Delay.

Bueno, seguro parecerá que Spirit Airlines no fue la mejor opción el verano pasado -pero tal vez la línea aérea tiene grandes retrasos en algunos aeropuertos, pero no en otros. Podemos revisar la visualización para incluir solo algunos aeropuertos.

Hay un par de maneras de reducir un subconjunto de datos. Se pueden aplicar filtros a un mismo gráfico, toda la página o todas las páginas de un informe de varias páginas. Puede cambiar los filtros durante la edición de un informe; pero si comparte posteriormente su trabajo como un panel de control de Power BI, los usuarios de solo lectura verán solo lo que ha filtrado y no podrán añadir los datos de nuevo.

Otra opción es añadir un 'Slicer' interactivo. Con éstas máquinas de cortar, si comparte más adelante su trabajo con otros, pueden filtrar de forma interactiva datos y añadirlos de nuevo.

Pruebe ambos.

Filtrado de los datos

Cuando empecé a trabajar con Power BI en marzo, un gran inconveniente era que no se podía añadir un cuadro de búsqueda de texto a un informe, una mesa o 'Slicer'. Si estaba analizando la información con una gran cantidad de diferentes categorías, tales como datos de vuelo de Estados Unidos, era bastante molesto tener que desplazarse a través de cientos de ciudades en una lista ordenada, por ejemplo, para encontrar St. Louis.

A partir de la actualización de software de escritorio de Power BI del 30 de junio, puede agregar una 'Slicer' de búsqueda de texto a sus informes, por lo que es más fácil afinar un elemento en medio de cientos (o miles). Más sobre esto en un momento. Pero también es posible que usted sepa que hay solo unos pocos artículos de interés entre los cientos de personas en su lista, y desea crear un informe con solo un subconjunto de los datos.

Una forma de hacer esto es filtrar un informe en pocas categorías principales -en este caso, tal vez mostrando solo algunas ciudades que son de interés conocido, como en las que su empresa tiene oficinas.

Para ello, haga clic en un área vacía del lienzo y arrastre DEST_CITY_NAMEen los filtros del informe (donde se ve el área que dice "Arrastre los datos aquí). Escoja algunas ciudades. Si está siguiendo, elegí Atlanta, Boston, Chicago, Cleveland, Las Vegas, Los Ángeles, Nueva Orleans, Nueva York, Filadelfia, San Francisco, San José, Seattle y Washington, DC

Haga clic en el encabezado DEST_CITY_NAMEen el filtro para cerrarlo. Luego haga lo mismo para ORIGIN_CITY_NAME-arrástrela en la parte superior del filtro DEST_CITY_NAMEy seleccione las ciudades que desea -y solo tendrá información de vuelos entre sus ciudades principales.

En este punto, puede ser digno de mención en el propio informe de que los datos ahora son de unas pocas ciudades. Se puede añadir texto a la página haciendo clic en el botón 'Cuadro de texto' en la cinta principal. Mueva y dele forma de la forma que desee en el lienzo y luego escriba un texto que explique las ciudades que cubre el informe.

Ahora podemos hacer que los usuarios elijan las ciudades de origen y destino con mayor facilidad mediante la adición de un par de máquinas de cortar. Haga clic en un área vacía del lienzo; a continuación, haga clic en el ícono de visualización de la 'Slicer' (se parece a un pequeño filtro/túnel en el ícono de la tabla bajo 'Visualizaciones' -en la versión de mayo 2016 de Power BI, es el tercero del último ícono bajo 'Visualizaciones'). Compruebe ORIGIN_CITY_NAME. Ahora haga clic en un área vacía otra vez, haga clic en el ícono de la 'Slicer' una segunda vez, y luego haga clic en DEST_CITY_NAME. Dele tamaño y mueva las máquinas de cortar como lo desee.

Si todavía tiene suficientes ciudades en su 'Slicer' que hacen que valga la pena añadir un campo de búsqueda, haga clic en los puntos suspensivos en la parte superior derecha de la 'Slicer' y seleccione 'Buscar'. Esto añadirá un cuadro de búsqueda de texto a la 'Slicer'.

Adición de un cuadro de búsqueda para una 'Slicer'.
Microsoft POwer BI

Si el texto es un poco pequeño y difícil de leer, haga clic en cada 'Slicer'; a continuación, haga clic en el ícono del cepillo y elija un nuevo tamaño de texto en 'Elementos'. Al igual que con el gráfico, puede cambiar el título y hacer clic en los campos para cambiar su nombre (de, por ejemplo, ORIGIN_CITY_NAMEa Ciudad de Origeny DEST_CITY_NAMEa Ciudad de destino) y aumente el tamaño de fuente del encabezado.

Es probable que ahora pueda ver el beneficio de filtrar los datos primero: Sin ese filtro a nivel de página, no habría más de 300 ciudades para recorrer en cada 'Slicer'.

Por último, podría ser interesante ver los vuelos reales, no solo la línea aérea. Arrastre la línea aérea a un espacio vacío en el lienzo y luego añada FL_NUM. Obtendrá una tabla. Añada Retardo de partiday Retardo de llegada, y luego una vez más, asegúrese de cambiar de Sumaa Media(en Valores). Cambie el nombre de FL_NUM a 'Vuelo'. Puede añadir la hora de salida programada haciendo clic en CRS_DEP_TIMEy agregarlo también a la tabla.

Ahora cuando haga clic en una ciudad de origen y destino en los 'Slicers', verá todos los vuelos disponibles y sus demoras promedio de llegada y salida. Si hace clic en la barra de una línea aérea en el gráfico, la tabla mostrará simplemente vuelos de esa aerolínea.

(Nota: No es muy fácil de encontrar, pero se puede personalizar la forma en que los gráficos interactúan entre sí en su página. Haga clic en un gráfico para activarlo; a continuación, en la cinta de formato, seleccione 'Edición de Interacciones'. Los otros gráficos en la página tendrán algunos íconos adicionales: un filtro y un círculo con raya vertical. Al hacer clic en el filtro, el gráfico cambiará en base a lo que sucede en el gráfico activo, hacer clic en el círculo con barra significa que no lo hará).

También es fácil tomar los mismos gráficos y mirar las medianas en lugar de los promedios, ya que unos pocos desafortunados vuelos retrasados podrían tener un efecto desmesurado en los promedios generales. Al igual que en Excel, puede agregar una página a su informe de Power BI haciendo clic en el signo más al lado de la pestaña con el nombre de la página (por defecto debe ser la página 1).

Incluso más práctico, ya que tenemos Silicers y un gráfico de toda la preparación: Haga clic derecho en la página y duplíquela. Ahora es más fácil hacer clic en el gráfico; bajo la sección 'Valor', haga clic en el promedio de retardo y de las partidas y llegadas y cámbielas a 'Mediana'. Si nos está siguiendo, también querrá cambiar el título del gráfico y la tabla con los datos de vuelo de 'Promedio' a 'Mediana'.

Cada línea aérea tenía una mediana de retraso de 0 o por debajo en todas estas ciudades combinadas -a excepción de Spirit. Cuando veo los vuelos que llegan a Boston, los retrasos de Spirit se ven más pronunciados -aunque para ser justos, podrían haber tenido un mal verano en el 2015 y mejorado desde entonces.

Un gráfico que muestra los vuelos que llegan a Boston.
Microsoft Power BI

Niveles de detalle interactivos

¿Interesado en cómo las demoras promedio se detallan por mes? Power BI tiene desglose automático de campos de fecha, que podemos ver mediante la creación de una nueva visualización en una página nueva.

Una vez más, haga clic en la página 1 y duplíquela, haga clic en el gráfico para activarlo, y luego desmarque Aerolíneasy haga clic en FL_DATE. Solo verá dos barras en el gráfico, una para cada llegada y salida.

Esto se debe a que Power BI hace que los gráficos sean por defecto anuales. Bajo Axis, puede hacer clic en la X junto a Año para eliminar ese modo y la gráfica dejará de mostrarse de forma anual (lo cual es un tanto inútil para estos datos). Ahora está predeterminado por cuartos. Eso, tampoco es de mucha utilidad para este conjunto de datos de cuatro meses en particular, pero vamos a suponer que lo es.

Para habilitar los niveles de detalle en Power BI, haga clic en la flecha hacia abajo en la parte superior derecha del gráfico. Ahora, si hace clic en una de las barras del tercer trimestre, le mostrará los meses. Haga clic en la barra de un mes, y se ampliarán los días de ese mes.

Para volver a los grupos más grandes de tiempo, haga clic en la flecha hacia arriba en la parte superior izquierda del gráfico. Tenga en cuenta que mientras está viendo detalles hacia arriba y abajo, no estará afectando otros elementos visuales de la página, por lo que los datos de la tabla no van a cambiar.

Los desgloses se automatizan en campos de fecha, pero se pueden configurar para cualquier jerarquía. Active el gráfico en la primera página, a continuación, arrastre FL_NUMen el campo del Axis, asegurándose de que esté por debajo de la línea aérea. No aparecerá nada para cambiar en el gráfico excepto que aparecerán íconos de desglose.

Haga clic en la flecha hacia abajo en la parte superior derecha para activar el desglose, haga clic en la barra de una compañía aérea, y verá todos los datos de vuelos individuales de esa aerolínea. Una vez más, debido a que el desglose está activo, no verá ningún cambio en la tabla. Si quiere filtrar manualmente la tabla de una línea aérea específica mientras esto sucede, puede añadir temporalmente Aerolíneacomo un filtro a nivel de página o añadir un tercer 'Slicer' para Aerolínea.

Haga clic en la flecha hacia arriba en la parte superior izquierda para volver al gráfico original, haga clic en la flecha hacia abajo de nuevo para desactivar las capacidades de desglose si todavía están seleccionadas, y el gráfico funcionará como antes.

Si desea cambiar el título del gráfico en esta página, active el gráfico una vez más, haga clic en el ícono de pincel en el panel de visualización y luego haga clic en 'Título'.

Como paso final, es posible que desee cambiar el nombre de las pestañas de las páginas a "Página 1" y "Duplicado de la Página 1" a algo más significativo. Esto no funciona actualmente de la misma manera que en Excel -en lugar de hacer clic derecho en una pestaña, es necesario hacer doble clic en el nombre de la pestaña.

Hay muchas más visualizaciones que se pueden generar en Power BI. Además de todos los íconos en el panel de visualizaciones, incluyendo mapas de árboles y mapas geográficos reales, hay otros gráficos disponibles para importar desde la Galería de las representaciones visuales personalizadas. Si encuentra uno que le guste, descárguelo desde la galería e impórtelo utilizando los puntos suspensivos junto al último ícono en el panel de visualizaciones. Tiene que importarlo por separado a cualquier informe en el que desee utilizarlo. (Se puede encontrar un ejemplo de uno de los elementos visuales personalizados más recientes creados por Microsoft Research aquí.)

Hay muchas otras formas de visualizar estos datos, tales como mirar las columnas con motivos de los retrasos, pero por ahora voy a pasar a otro punto.

Compartir su trabajo

Después de haber hecho algunas visualizaciones de exploración, es posible que desee compartir algunos de sus análisis con los compañeros de trabajo. Para ello, primero tiene que publicar sus datos e informar al servicio en la nube de Power BI. Guarde su trabajo, a continuación, vaya a Inicio > Publicar. Tendrá que iniciar sesión en su cuenta de Power BI si está registrado (o crear una cuenta si todavía no tiene una).

Después que los datos se publican en el servicio en la nube de Power BI, se le ofrecerá la oportunidad de "Obtener una vista rápida" de sus datos. Esta es la mirada automatizada de Microsoft a través de varios puntos de datos con el fin de resaltar cosas como valores atípicos y correlaciones. Por desgracia, 'Vista rápida'desconoce que no debe sumar todos los tiempos de retardo -necesita un promedio de ellos para que tenga sentido. (Espero que el defecto pueda funcionar mucho mejor para los archivos de datos como las ventas y ganancias, en los que las sumas por región o tienda en el tiempo podrían tener sentido.)

'Vista rápida' o Quick Insides intenta llamar aspectos interesantes de sus datos. Sin embargo, para que esto funcione correctamente sus datos tienen que estar en un formato que pueda entender.
Microsoft Power BI

Probé una Vista rápida mediante la duplicación de mi proyecto (lo guardé con otro nombre), y luego agrupé datos por la ciudad de destino, la compañía aérea y el vuelo. (Si desea seguir adelante, vaya a Editar Consultas > Transformar > Agrupar pory siga el cuadro de diálogo para crear una nueva columna de promedio de demoras de llegada, seleccione Cerrary Aplicar, vuelva a hacer sus visualizaciones, y a continuación, Publicar).

Para obtener una Vista rápida sobre un conjunto de datos en el servicio en la nube de Power BI, haga clic en los puntos suspensivos junto a su nombre en el menú de la izquierda (haga clic en el ícono del menú de tres líneas en la parte superior izquierda para mostrar el menú si no es visible) y seleccione Vista rápida. (¿No encuentra una Vista rápida? Asegúrese de que está haciendo esto en conjuntos de datos y no en Informes.)

Luego de ver una Vista rápida, vaya a la página principal de la nube Power BI, inicie sesión si es necesario, haga clic en el ícono de tres líneas horizontales en la parte superior izquierda para ver el menú (si es necesario), y debería ver todos sus conjuntos de datos, Los informes y cuadros de mando. Si ya ha creado las páginas del informe de visualización en el software de escritorio antes de publicarlo en el servicio, aparecerá en Informes (sus datos, como es lógico, se presentan bajo Conjuntos de datos).

Puede compartir un informe directamente a la web para que sea visto por el público, lo que a su vez también le permite incluirlo en algún lugar de su propio sitio web: Vaya a Archivo > Publicar en Web.

Si se trata de datos privados que desea compartir con solo unas pocas personas, tendrá que compartir su trabajo como un panel de control. Si desea compartir una página entera de un informe como panel de control, haga clic en el ícono de marcador (chincheta) justo por encima de la página, y elija agregar a un nuevo panel de control. También puede mezclar y comparar visualizaciones de diferentes páginas -o incluso diferentes conjuntos de datos- en un panel haciendo clic en una visualización individual, y luego clic en el ícono de bloqueo en la parte superior derecha de esa visualización y fijarlo en un panel nuevo o existente. A continuación, puede hacer clic en el ícono de compartir en la parte superior derecha y compartir con los demás mediante la introducción de sus direcciones de correo electrónico.

El cuadro de diálogo es bastante auto-explicativo, permitiéndole decidir si los destinatarios pueden volver a compartirlo o simplemente verlo. (Al escribir estas líneas, la seguridad a nivel de registro está disponible para algunos conjuntos de datos, lo que permite que solo ciertos usuarios puedan ver la información más sensible en un conjunto de datos, además algunas de las características se encuentran en vista previa y es probable que cambien.)

Puede incrustar contenido web, imágenes, cuadros de texto y videos en el panel desde el propio panel de control; también puede crear visualizaciones adicionales en un informe y fijarlas a un tablero de instrumentos, incluyendo la adición de "tarjetas" que llaman una o un par de métricas clave. Puede editar su informe en el servicio de Power BI haciendo clic en el enlace Editar informesobre la página, y luego fijar una nueva visualización a cualquier panel de control.

Puede permitir a sus usuarios realizar preguntas en lenguaje natural haciendo clic en el ícono de engranaje en la barra de navegación superior (negra), haciendo clic en los paneles de control y luego el panel de control específico que desea editar. Haga clic en la casilla junto a "Mostrar un cuadro de búsqueda de preguntas y respuestas en este panel de control".

Esta característica le permite (y a quienes ven su panel) generar nuevas visualizaciones de un conjunto de datos escribiendo preguntas. Una vez que me di cuenta de los formatos adecuados para mis consultas, encontré que ésta es una interfaz bastante convincente. Por ejemplo, importé los datos de visitas mensuales de búsqueda a sitios web de los Estados Unidos de IDG y luego pude ver varios trozos de datos escribiendo cosas como "Muéstrame búsqueda de visitas mensuales a Computerworld" o "¿Qué mes tuvo las mayores visitas de búsqueda para CIO? Y si bien pude haber creado la misma interactividad con Slicers en una página de informe que haya fijado a un panel de control, el valor agregado es que los usuarios pueden hacer preguntas que no necesariamente he modelado para ellos.

Para los datos de vuelo, consulté mi panel de control con preguntas como "¿Qué ciudad de origen cuenta con el mayor retraso medio de seguridad?" (Isla de Adak, Alaska. ¿Quién lo sabía?) Y "¿Qué ciudad de destino tiene el mayor retardo de tiempo promedio desde Boston?"

A medida que escribe algo que Power BI reconoce como posiblemente proveniente de su conjunto de datos, la palabra se subraya y aparecen opciones que puede seleccionar. ¿Quiere a Boston en Ciudad de Origen o en Ciudad de Destino? Haga clic y elija. Si el tipo de visualización -como columna o barra- no es el que desea, puede especificar uno en su consulta.

Los paneles de control de Power BI ofrecen consultas en lenguaje natural, y subraya los nombres de columna en los conjuntos de datos.
Microsoft Power BI

Una objeción: Tratar de obtener datos para una ciudad como San Francisco o Nueva York no funcionó para mí, porque el sistema no reconoció el nombre de la ciudad hasta que escribí la cuarta letra; tres letras y un espacio no funcionaron tan bien. Afortunadamente, también podía utilizar SFO (para San Francisco) o JFK y LGA (para Nueva York) para el código de aeropuerto de origen -pero eso es algo a tener en cuenta si desea utilizar esta función y si tiene ciudades en sus datos.

Si los datos no tienen nombres de columna intuitivos, puede añadir un "sinónimo" de un modelo de datos -solo en escritorio- como forma alternativa de hacer referencia a una columna. Haga clic en el ícono de Relacionesen el panel de la izquierda (que es el tercer ícono que muestra tres cajas), seleccione 'Modelado', y debería ver un ícono de 'Sinónimos' y la lista de campos a la derecha. Si hace clic en el cuadro de texto debajo de la ciudad de origen, por ejemplo, se pueden introducir nombres sustitutivos adicionales, tales como 'Salida'.

Conclusión

En pocas semanas de trabajo con Power BI, me pareció que es una plataforma bastante intuitiva para la carga de datos, y rápida para la exploración básica de datos y su visualización.

En la Cumbre de Perspectivas de datos de Microsoft en marzo, a Power BI le faltaban algunas funciones que considero básicas -la búsqueda de texto para las Slicers, el formato condicional para las tablas de datos, recolectores de datos calendarios como Slicers- pero Microsoft ha progresado desde entonces en la mejora de la plataforma. El formato condicional para las tablas se añadió en la actualización de escritorio del 31 de mayo, los Sliders de búsqueda llegaron en la actualización del 30 de junio, y Microsoft dice que los recolectores de mejor rango están en proceso.

La plataforma se actualiza con bastante frecuencia -una vez al mes para el escritorio, y con más frecuencia para el servicio en la nube- que ofrece la promesa de la continuación de nuevas características y funcionalidades. Y como usuario R, estoy intrigado por la integración de secuencias de comandos R dentro del software y los recientes anuncios de Microsoft sobre gráficos R en el servicio Power BI (es necesario tener una cuenta Pro) -a pesar de que definitivamente no necesita saber o utilizar R para Power BI.

Si ya utiliza Excel -especialmente en Windows- o si es una tienda de Microsoft con los datos corporativos almacenados en la infraestructura de Microsoft, me gustaría recomendar la descarga de Power BI, regístrese en una cuenta gratuita y prueba Power BI. Si no utiliza otros productos de Microsoft, puede que valga la pena probar la plataforma, si quiere hacer algo de exploración rápida de datos y análisis, y actualmente no tiene una plataforma favorita, ya que Power BI traerá muchos formatos de datos, además de hojas de cálculo, SQL Server y Microsoft Azure.

Si bien me decepcionaron las dos conexiones de paquetes de datos que probé (Adobe Analytics y Google Analytics), en gran parte debido a que no cubren las tendencias de contenido de sitio a largo plazo, eso no quiere decir que algunos de los otros como Salesforce o MailChimp no funcionarían para usted. Y Microsoft está desarrollando lo que denomina "plantillas de solución de clase empresarial" -hay un par de ofertas de Salesforce y Dynamics CRM, por ejemplo- que están destinadas a hacer más fácil el análisis de información corporativa. (Microsoft dice que los editores de contenido suelen ser responsables de qué escenarios hay que centrarse.)

En pocas palabras, Microsoft diseñó Power BI para que los usuarios de negocios hagan análisis de auto-servicio, en algunos casos con la ayuda de TI para configurar las puertas de enlace o "paquetes de contenido" interno que se conectan a los datos internos. No es una plataforma tan robusta como, digamos, Tableau -ni con el precio tan alto para el análisis de los datos privados. (Tableau Public es gratuito, pero tiene menos funcionalidades que el software de pago y no está diseñado para compartir datos privados, que suelen ser críticos para usuarios de la empresa.)

Si es un analista de datos a tiempo completo o diseñador comercial en la creación de gráficos con calidad de publicación, esto no puede ser para usted. Pero si no necesita personalización y funcionalidad de alta calidad, mientras analiza datos y comparte su trabajo, esto podría ser una alternativa atractiva.