knitr::opts_chunk$set(echo = FALSE) library(learnr) library(readr) library(dplyr) library(GGally) library(lubridate) library(tm) library(wordcloud) library(tidyr) library(gradethis) tutorial_options(exercise.checker = gradethis::grade_learnr) temp = tempfile(fileext = ".xlsx") dataURL <- "https://storage.googleapis.com/datos_cursos/properati-AR-2017-08-01-properties_short.xlsx" download.file(dataURL, destfile = temp, mode = 'wb') sell_0217 <- readxl::read_excel(temp) propiedades <- sell_0217 %>% slice_head(n = 1000) select(-c(operation, country_name, geonames_id, lat, lon)) sell_0217 %>% rename(id_nuevo = id) rm(sell_0217) prueba <- propiedades %>% select(property_type, currency, price, surface_total_in_m2, surface_covered_in_m2) %>% sample_frac(0.1) prueba <- propiedades %>% sample_frac(0.01) %>% mutate(mes = month(created_on)) %>% mutate(property_factor = as.factor(property_type)) %>% select(property_factor, mes, price_aprox_usd, surface_total_in_m2, surface_covered_in_m2)
knitr::include_graphics( "https://storage.googleapis.com/datos_cursos/ixpantia_introR/ixpantia_logo.png" )
Este conjunto de datos incluye de información sobre propiedades en venta en Argentina en el 2017 de la compañía Properati.
glimpse(propiedades)
Descripción de las variables
| Variable | Descripción |
| :--------: | :-----------: |
| id
| Identificador |
| created_on
| Fecha de construccion de la propiedad |
| property_type
| Tipo de propiedad |
| place_name
| Nombre del lugar donde se ubica la propiedad |
| place_with_parent_names
| Nombre completo del lugar donde se ubica la propiedad |
| state_name
| Nombre del estado donde se ubica la propiedad |
| lat
| Latitud |
| lon
| Longitud |
| price
| Precio de la propiedad |
| currency
| Moneda en la que está el precio |
| price_aprox_local_currency
| Precio aproximado en la moneda local (peso argentino) |
| price_aprox_usd
| Precio aproximado en dólares estadounidenses |
| surface_total_in_m2
| Superficie total en m2 |
| surface_covered_in_m2
| Superficie cubierta por la construcción en m2 |
| price_usd_per_m2
| Precio en dólares por m2 |
| price_per_m2
| Precio por m2 |
| floor
| Cantidad de pisos en la propiedad |
| rooms
| Cantidad de habitaciones |
| expenses
| Dinero invertido en la propiedad |
| properati_url
| URL de la información de la propiedad |
| description
| Descripción de la propiedad |
| title
| Título de la propiedad |
| image_thumbnail
| Foto de la propiedad |
En el conjunto de datos propiedades hay una variable llamada
surface_total_in_m2
que describe la superficie total de la propiedad. Una
segunda variable, property_type
, contiene el tipo de propiedad. Ahora descubra
cuánta superficie tienen las propiedades de tipo casa y tipo apartamento en
promedio.
propiedades %>%
"summarize(promedio = mean(surface_total_in_m2, na.rm = TRUE))"
grade_result( pass_if(~ identical(unlist(.result), unlist(propiedades %>% group_by(property_type) %>% summarize( promedio = mean(surface_total_in_m2, na.rm = TRUE)))), "¡Muy bien!") )
En el conjunto de datos propiedades hay una variable llamada
price_aprox_usd
que contiene el precio aproximado en dólares de la propiedad.
Utilizando esta variable, descubra cuál es el estado (state_name
) más
costoso en Argentina basado en propiedades.
propiedades %>%
"summarise(precio_promedio = mean(price_aprox_usd, na.rm = TRUE))"
grade_result( pass_if(~ identical(unlist(.result), unlist(propiedades %>% group_by(state_name) %>% summarise(precio_promedio = mean(price_aprox_usd, na.rm = TRUE) ) %>% arrange(desc(precio_promedio)))), "¡Excelente!") )
En el conjunto de datos que estamos trabajando hay una columna que se llama
price_aprox_usd
con el precio al que se vendió la propiedad estandarizado a
dólares y otra llamada currency
con la moneda en la que se encuentra ese
precio. Utilizando estas dos columnas y otras herramientas descubra si las
casas que se venden en dólares son más costosas que las que se venden en la
moneda local (pesos argentinos).
propiedades %>%
"summarise(promedio = mean(price_aprox_usd))"
grade_result( pass_if(~ identical(unlist(.result), unlist(propiedades %>% group_by(currency) %>% summarise(promedio = mean(price_aprox_usd)))), "¡Excelente!") )
En propiedades tenemos una variables rooms
que describe cuantas
habitaciones tiene la propiedad y otra, price_usd_per_m2
donde se dice el
precio por m2, en dólares, de la propiedad. Utilizando estas columnas y otras
herramientas averigue cuál es la cantidad óptima de cuartos en una casa para
optimizar el valor por m2, es decir, para que este valor promedio sea el mayor
posible.
propiedades %>%
"summarise(promedio = mean(price_usd_per_m2, na.rm = TRUE))"
grade_result( pass_if(~ identical(unlist(.result), unlist(propiedades %>% group_by(rooms) %>% summarise(promedio = mean(price_usd_per_m2, na.rm = TRUE)) %>% arrange(desc(promedio)))), "¡Bien hecho!") )
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.