Llegamos a ustedes gracias a:



Reportajes y análisis

Grandes paquetes R

Para la importación de datos, discusiones y visualización

Algunas de las muchas opciones de visualización de datos disponibles a través de la API de Google Charts, que puede aprovechar con el uso de un paquete de R. Crédito: Google
Paquetes R

[31/05/2015] Una de las mejores cosas de R son los miles de paquetes que los usuarios han escrito para resolver problemas específicos en varias disciplinas -analizando todo, desde el clima o datos financieros, hasta el genoma humano, -sin mencionar el análisis de violaciones de datos en seguridad informática.

Sin embargo, algunas tareas son comunes a casi todos los usuarios, independientemente del área de trabajo: importación, discusiones y visualización de datos. La tabla de abajo muestra mis paquetes favoritos para una de estas tres tareas (además de unas cuantas funciones misceláneas). Los nombres empaquetados en la tabla son cliqueables si desea más información. Para averiguar más acerca de un paquete una vez que lo haya instalado, digite help(package = "nombre del paquete) en su consola R (por supuesto sustituyendo el nombre del paquete).

Paquete Categoría Descripción Ejemplo de uso Autor
Analíticas web Use Google Analytics con R. GitHub skardhamar/rga. Vea el paquete de archivo README y my tutorial Bror Skardhamar
RSiteCatalyst Web analytics Use Adobe Analytics con R. GitHub randyzwitch/RSiteCatalyst. Ver video de introducción Randy Zwitch
devtools Desarrollo de paquete, instalación de paquete Aunque las devtools tienen como objetivo ayudarlo a crear sus propios paquetes R, también son esenciales si desea instalar fácilmente otros paquetes de GitHub. Instálelas. Requiere Rtools sobre Windows y XCode en Mac. En CRAN. install_github("rstudio/leaflet") Hadley Wickham & otros
roxygen2 Desarrollo de paquete Una herramienta útil para documentar las funciones dentro de paquetes R. CRAN. Vea esta nota breve y fácil de leeracerca de escribir paquetes R Hadley Wickham & otros
installr Misc Solo Windows: Actualice su versión instalada de R desde dentro de R. En CRAN. updateR() Tal Galili & otros
fitbitScraper Misc Importe datos Fitbit desde su cuenta dentro de R. CRAN. cookie <- login(email="", password="")
df <- get_daily_data(cookie, what="steps", "2015-01-01", "2015-05-18")
Cory Nisson
xlsx misc Si necesita escribir un archivo Excel así como leerlo, este paquete puede ser algo lento pero también es muy fácil de usar. CRAN. write.xlsx(mydf, "myfile.xlsx") Adrian A. Dragulescu
leaflet mapeo Mapee datos usando la librería Leaflet JavaScript dentro de R. GitHub rstudio/leaflet. See my tutorial RStudio
choroplethr mapeo Formas fáciles de mapear datos con información incorporada de estado, país, código postal e información geográfica de país; puede importar sus propios archivos de forma. Este paquete de mapeo es mejor para exploración de datos que para publicación ya que no estandariza las proyecciones. CRAN. data(df_pop_state)
state_choropleth(df_pop_state)
Ari Lamstein en Trulia
tmap mapeo No son los mapas más pulidos para publicación o presentación, pero este nuevo paquete ofrece una forma muy sencilla de leer archivos en forma, y de unir archivos de datos con información geográfica, así como hacer algún mapeo de exploración. CRAN. See the package vignette Martijn Tennekes
sqldf Discusión de datos, análisis de datos ¿Conoce una gran consulta SQL que usaría si su frame de datos R estuviera en una base de datos SQL? Ejecute solicitudes SQL en su frame de datos con sqldf. CRAN. sqldf("select * from mydf where mycol > 4") G. Grothendieck
dplyr Discusión de datos, análisis de datos El paquete esencial de munging de datos R cuando se trabaja con frames de datos. Especialmente útil para operar sobre datos por categorías. CRAN. Vea la viñeta de presentación Hadley Wickham
data.table Discusión de datos, análisis de datos Popular paquete para discusión pesada de datos. Aunque normalmente prefiero dplyr, data.table tiene muchos seguidores por su velocidad con grandes conjuntos de datos. CRAN. Tutorial útil Matt Dowle y otros
zoo Discusión de datos, análisis de datos Paquete robusto con un montón de funciones para trabajar con datos de series de tiempo; me gusta la práctica función rollmean para calcular promedios de movimiento. CRAN. rollmean(mydf, 7) Achim Zeileis y otros
plyr Discusión de datos Auque dplyr es mi paquete favorito para frames de discusión de datos, el antiguo paquete plyr aún es práctico cuando se trabaja con otros tipos de datos R como listas. CRAN. llply(mylist, myfunction) Hadley Wickham
reshape2 Discusión de datos Cambie formatos de filas y columnas de datos de "anchos a "largos; convierta variables en nombres de columnas o nombres de columnas en variables y más. El paquete tidyr es una opción más nueva, más enfocada, pero aún utilizo reshape2. CRAN. Vea mi turorial Hadley Wickham
stringr Discusión de datos Numerosas funciones para manipulación de textos. Algunas son similares a las funciones básicas R actuales pero en un formato más estándar, incluyendo el trabajo con expresiones regulares. Algunas de mis favoritas: str_pad and str_trim. CRAN. str_pad(myzipcodevector, 5, "left", "0") Hadley Wickham
lubridate Discusión de datos Todo lo que siempre quiso hacer con la aritmética de fechas, aunque entender y usar las funciones disponibles puede ser algo complejo. CRAN. mdy("05/06/2015") + months(1)
Más ejemplos en la viñeta de paquete
Garrett Grolemund, Hadley Wickham y otros
ggplot2 Visualización de datos Un paquete de dataviz potente flexible y bien pensado seguido de sintaxis de 'gramática de gráficos' para crear gráficos estáticos, pero prepárese para una curva de aprendizaje empinada. CRAN. qplot(factor(myfactor), data=mydf, geom="bar", fill=factor(myfactor)) Hadley Wickham
dygraphs Visualización de datos Cree gráficos HTML/JavaScript de series de tiempo - comando de una línea si sus datos están en un objeto xts. CRAN. dygraph(myxtsobject) JJ Allaire & RStudio
googleVis Visualización de datos Ingrese en los cuadros de Google usando R. CRAN. mychart <- gvisColumnChart(mydata)
plot(Column)
Varios ejemplos aquí
Markus Gesmann & others
metricsgraphics Visualización de datos Interfase R para la librería JavaScript de gráficas métricas para línea bare-bones, scatterplot y cuadros de barras. GitHub hrbrmstr/metricsgraphics. Vea la presentación del paquete Bob Rudis
RColorBrewer Visualización de datos ¿No es diseñador? RColorBrewer lo ayuda a seleccionar paletas de colores para sus visualizaciones. CRAN. Vea el tutorial de Jennifer Bryan Erich Neuwirth
plotly Visualización de datos Este le permite crear gráficos JavaScript interactivos en el servicio Plotly, el cual puede vincular o incrustar en una página Web. Se require una cuenta gratuita Plotly. GitHub ropensci/plotly. Vea ejemplos de documentación rOpenSci project
shiny Visualización de datos Convierta datos R en aplicaciones interactivas Web. No he usado esto mucho aún, pero he visto algunas apps simpáticas (algunas veces lentas) y tiene muchos entusiastas. CRAN. Vea el tutorial RStudio
rvest Importación de datos, scrapping de web Web scraping: Extraiga datos de páginas HTML. Inspirado en Beautiful Soup de Python. Funciona bien con Selectorgadget. CRAN. Vea la viñeta del paquete Hadley Wickham
jsonlite Importación de datos, discusión de datos analice gramaticalmente json dentro R convierta frames de data R dentro json. CRAN. myjson <- toJSON(mydf, pretty=TRUE)
mydf2 <- fromJSON(myjson)
Jeroen Ooms y otros
XML Importación de datos, discusión de datos Muchas funciones para trabajar elegantemente con XML y HTML, así comoreadHTMLTable. CRAN. mytables <- readHTMLTable(myurl) Duncan Temple Lang
quantmod Importación de datos, visualización de datos, análisis de datos Aún si usted no está interesado en analizar y graficar datos de inversión financiera, quantmod tiene funciones fáciles de usar para importar datos económicos y financieros de fuentes como la Reserva Federal. CRAN. getSymbols("AITINO", src="FRED") Jeffrey A. Ryan
googlesheets Importación de datos, exportación de datos Lea fácilmente datos en R desde hojas Google. En GitHub jennybc/googlesheets. mysheet <- register_ss("Google Spreadsheet Title")
mydata <- mysheet %>% get_via_csv(ws = "WorksheetTitle")
Jennifer Bryan
rio Importación de datos, exportación de datos Jale un montón de paquetes de datos separados en uno solo, así que solo tiene que recordar dos funciones: importar y exportar. CRAN. import("myfile") Thomas J. Leeper & others
readxl Importación de datos Una forma rápida de leer archivos Excel en R, sin dependencias, como Java. En GitHub hadley/readxl. read_excel("my-spreadsheet.xls", sheet = 1) Hadley Wickham
RMySQL Importación de datos Lea datos desde una base de datos MySQL dentro de R. Hay paquetes similares para otras bases de datos. con <- dbConnect(RMySQL::MySQL(), group = "my-db")
myresults <- dbSendQuery(con, "SELECT * FROM mytable")
Jeroen Ooms y otros
readr Importación de datos El R base maneja la mayoría de estas funciones; pero si tiene archivos enormes, esta es una forma veloz y estandarizada de leer archivos tubulares como CSVs en frames de datos R, así como archivos de texto simple en cadenas de caracteres con read_file.CRAN. read_csv(myfile.csv) Hadley Wickham
listviewer Display de datos, discusión de datos Elegante forma de ver listas anidadas complejas dentro de R. GitHub timelyportfolio/listviewer. jsonedit(mylist) Kent Russell
editR Display de datos Editor interactivo para documentosR Markdown. GitHub swarm-lab/editR. editR("path/to/file.Rmd") Simon Garnier
knitr Display de datos Agregue R a un document marcado y genere fácilmente reportes en HTML, Word y otros formatos. Un elemento obligatorio si está interesado en investigación reproducible y en automatizar el viaje desde el análisis de datos hasta la creación de reportes. CRAN. Este tutorial tiene unos cuantos años de antigüedad pero maneja lo básico Yihui Xie & others
DT Display de datos Cree una tabla buscable en una línea de código con esta interfaz R al plugin jQuery DataTables plug-in. GitHub rstudio/DT. datatable(mydf) RStudio
psych Display de datos No. No uso personalmente las funciones analizo; pero sí uso regularmente las funciones describe y describeBy para sumarizar conjuntos de datos. CRAN. describe(mydf) William Revelle

Algunos puntos importantes para novatos

Para instalar un paquete de CRAN use el comando install.packages("nombredelpaquete) -por supuesto sustituyendo el nombre real del paquete y colocándolo entre comillas. Los nombres de los paquetes, como muchas otras cosas en R, son sensibles a mayúsculas.

Para instalar desde GitHub, es más fácil utilizar la función install-github del paquete de devtools, utilizando el formato devtools::install_github("githubnombredecuenta/nombredepaquete). Eso significa que primero deberá instalar el paquete de devtools en su sistema con install.packages("devtools). Note que las devtools a veces necesitan algún software adicional no R en la computadora, más específicamente, una descarga de Rtools para Windows o Xcode para OS X. Hay más información acerca de las devtools aquí.

Para utilizar una función de un paquete durante su sesión de R, deberá hacer una de las dos siguientes cosas. Una opción es cargar en su sesión de R la library("nombredelpaquete) o require("nombredelpaquete). Lo otro es llamar a la función incluyendo el nombre del paquete, como esto: Nombredelpaquete::nombredelafuncion().

Sharon Machilis, Computreworld (EE.UU.)