r project nube (1)
Post on 02-Jul-2015
208 Views
Preview:
DESCRIPTION
TRANSCRIPT
Extracción y visualización de open data desde la nube utilizando R Project
Deybi Morales LeónUsuarios R Nicaraguahttps://www.facebook.com/groups/usuariosrnicaragua/
¿Qué es R?Es un lenguaje y entorno de programación estadística
www.r-project.org www.rstudio.com
PaquetesR contiene 5778 paquetes para trabajar todas las áreas de estadísticas y su utilización en la mayoría de las ciencias.--Alta calidad gráfica (3D, estáticos, dinámicos, mapas, etc)--Creación de informes con LaTeX y html.--Extracción de bases de datos desde las nubes.--Interacción con otros programas (Excel, matlab, python, eviews, etc)
Filosofía y práctica que persigue que determinados tipos de datos estén disponibles de forma libre para todo el mundo, sin restricciones de derechos de autor, de patentes o de otros mecanismos de control.
Disponibilidad por el internet
Datos económicos-Crecimientos del PIB-Deuda externa-Balanza comercial -etc.
Datos financieros-Tasas de interés-Precios de las acciones-Índices bursátiles, -etc.
Datos ambientales-Emisiones de CO2 -etc.
Datos Sociales-Tasa de natalidad-Tasa de mortalidad-Índices bursátiles, -etc.
Utilización de API para Facebook y Twitter
Paquetes disponibles para extracción de la nube
fImport Rmetrics - Economic and Financial Data ImportrWBclimateA package for accessing World Bank climate dataWDIWorld Development Indicators (World Bank)ggmapA package for spatial visualization with Google Maps and OpenStreetMapgooglePublicDataAn R library to build Google's Public Data Explorer DSPL Metadata filesweatherDataGet Weather Data from the WebemdatrGlobal Disaster Losses from the EMDAT database Using RergmharrisLocal Health Department network data set
fImport Rmetrics - Economic and Financial Data Import
fueleconomy EPA fuel economy data
GCD Global Charcoal Database
geomapdata Data for topographic and Geologic Mapping
govStatJPN functions to get public survey data in Japan
gpk 100 Data Sets for Statistics Education
zipcode U.S. ZIP Code database for geocoding
vegdata Functions to access vegetation databases (Turboveg) and prepare vegetation data especially its taxonomy for analysis
fExtremes Rmetrics - Extreme Financial Market Data
fImport Rmetrics - Economic and Financial Data Import
fueleconomy EPA fuel economy data
GCD Global Charcoal Database
geomapdata Data for topographic and Geologic Mapping
govStatJPN functions to get public survey data in Japan
gpk 100 Data Sets for Statistics Education
zipcode U.S. ZIP Code database for geocoding
ustyc Fetch US Treasury yield curve data
UScancer Create US cancer datasets from SEER, IARC, and US Census data
Paquetes gráficos
ggplot2 An implementation of the Grammar of Graphicslattice Lattice Graphics
Ejemplos
Abonados a internet por cada 100 personas
Primero instalar el paquete WDI, este es para el Banco Mundialinstall.packages(“WDI”)library(WDI)
Identificar el indicador buscado, con una palabra como en googleindicadores<-WDIsearch(“internet”)View(indicadores)
usuarios.internet<-WDI(country="all", indicator=indicadores[10,1], start=2012, end=2012)
Activar ggplot2library(ggplot2)
qplot(data=usuarios.internet[100:258,], x=iso2c, y=IT.NET.USER.P2, main="2012 Usuarios de internet", xlab="", ylab="Usuarios por cada 100") + geom_text(aes(label=country), size=4, angle=45, hjust=1, vjust=1, color="black") + geom_point(aes(size=IT.NET.USER.P2), colour="blue", alpha=0.9)
¿Dónde mis hijos tendrán mayores probabilidades de vida?
library(WDI)indicadores<-WDIsearch("life")View(indicadores)
library(maps)library(RColorBrewer)library("ggplot2")library("plyr")library("scales")library("rgeos")library("ggmap")library("mapproj")library("maptools")
data(wrld_simpl)world_ggmap <- fortify(wrld_simpl, region = "ISO2")head(world_ggmap)
indicadores<-WDIsearch(“life”)View(indicadores)
Años.vida<-WDI(country="all", indicator=indicadores[4,1], start=2012, end=2012)
ggplot(Años.vida, aes(map_id = iso2c)) + geom_map(aes(fill=SP.DYN.LE00.IN), map = world_ggmap, color="black") +expand_limits(x = world_ggmap$long, y = world_ggmap$lat) +xlab(NULL) + ylab(NULL) + ylim(c(-60, 80)) +scale_fill_gradient(low="white", high="blue",name="Años" ) +ggtitle("Esperanza de vida al nacer (Datos: 2012)")
install.packages("quantmod")library("quantmod")getSymbols("TWTR",src="yahoo") barChart(TWTR)View(TWTR)
Precios de acciones: El pajarito azul en problemas
Es necesario identificar el ticket de la acción, en este caso de ejemplo TWTR pertenece a Twitter.
Gracias
top related