knitr::opts_chunk$set(echo = FALSE)

library(learnr)
library(readr)
library(dplyr)
library(GGally)
library(lubridate)
library(tm)
library(wordcloud)
library(tidyr)
library(gradethis)
tutorial_options(exercise.checker = gradethis::grade_learnr)

temp = tempfile(fileext = ".xlsx")
dataURL <- "https://storage.googleapis.com/datos_cursos/properati-AR-2017-08-01-properties_short.xlsx"
download.file(dataURL, destfile = temp, mode = 'wb')
sell_0217 <- readxl::read_excel(temp)

propiedades <- sell_0217 %>% 
  slice_head(n = 1000)
  select(-c(operation, country_name, geonames_id, lat, lon))

sell_0217 %>%
  rename(id_nuevo = id)

rm(sell_0217)

prueba <- propiedades %>%
  select(property_type, currency, price,
         surface_total_in_m2, surface_covered_in_m2) %>%
  sample_frac(0.1)

prueba <- propiedades %>%
  sample_frac(0.01) %>%
  mutate(mes = month(created_on)) %>%
  mutate(property_factor = as.factor(property_type)) %>%
  select(property_factor, mes, price_aprox_usd, 
         surface_total_in_m2, surface_covered_in_m2)
knitr::include_graphics(
  "https://storage.googleapis.com/datos_cursos/ixpantia_introR/ixpantia_logo.png"
  )   

Datos: propiedades

Este conjunto de datos incluye de información sobre propiedades en venta en Argentina en el 2017 de la compañía Properati.

glimpse(propiedades)

Descripción de las variables

| Variable | Descripción | | :--------: | :-----------: | | id | Identificador | | created_on | Fecha de construccion de la propiedad | | property_type | Tipo de propiedad | | place_name | Nombre del lugar donde se ubica la propiedad | | place_with_parent_names | Nombre completo del lugar donde se ubica la propiedad | | state_name | Nombre del estado donde se ubica la propiedad | | lat | Latitud | | lon | Longitud | | price | Precio de la propiedad | | currency | Moneda en la que está el precio | | price_aprox_local_currency | Precio aproximado en la moneda local (peso argentino) | | price_aprox_usd | Precio aproximado en dólares estadounidenses | | surface_total_in_m2 | Superficie total en m2 | | surface_covered_in_m2 | Superficie cubierta por la construcción en m2 | | price_usd_per_m2 | Precio en dólares por m2 | | price_per_m2 | Precio por m2 | | floor | Cantidad de pisos en la propiedad | | rooms | Cantidad de habitaciones | | expenses | Dinero invertido en la propiedad | | properati_url | URL de la información de la propiedad | | description | Descripción de la propiedad | | title | Título de la propiedad | | image_thumbnail | Foto de la propiedad |

Preguntas

¿Cuánta superficie tienen casa y apartamentos en promedio?

En el conjunto de datos propiedades hay una variable llamada surface_total_in_m2 que describe la superficie total de la propiedad. Una segunda variable, property_type, contiene el tipo de propiedad. Ahora descubra cuánta superficie tienen las propiedades de tipo casa y tipo apartamento en promedio.

propiedades %>%
"summarize(promedio = mean(surface_total_in_m2, na.rm = TRUE))"
grade_result(
  pass_if(~ identical(unlist(.result),
                      unlist(propiedades %>%
                               group_by(property_type) %>%
                               summarize(
                                 promedio = mean(surface_total_in_m2,
                                                 na.rm = TRUE)))),
          "¡Muy bien!")
)

¿Cuál es el estado más costoso en Argentina en dólares?

En el conjunto de datos propiedades hay una variable llamada price_aprox_usd que contiene el precio aproximado en dólares de la propiedad. Utilizando esta variable, descubra cuál es el estado (state_name) más costoso en Argentina basado en propiedades.

propiedades %>%
"summarise(precio_promedio = mean(price_aprox_usd, na.rm = TRUE))"
grade_result(
  pass_if(~ identical(unlist(.result),
                      unlist(propiedades %>%
                               group_by(state_name) %>%
                               summarise(precio_promedio = mean(price_aprox_usd,
                                                                na.rm = TRUE)
                                         ) %>%
                               arrange(desc(precio_promedio)))),
          "¡Excelente!")
)

¿Las casas que se venden en dólares son más o menos costosas que las que se venden en pesos argentinos?

En el conjunto de datos que estamos trabajando hay una columna que se llama price_aprox_usd con el precio al que se vendió la propiedad estandarizado a dólares y otra llamada currency con la moneda en la que se encuentra ese precio. Utilizando estas dos columnas y otras herramientas descubra si las casas que se venden en dólares son más costosas que las que se venden en la moneda local (pesos argentinos).

propiedades %>%
"summarise(promedio = mean(price_aprox_usd))"
grade_result(
  pass_if(~ identical(unlist(.result),
                      unlist(propiedades %>%
                              group_by(currency) %>%
                              summarise(promedio = mean(price_aprox_usd)))),
          "¡Excelente!")
)

¿Cuál es la cantidad óptima de cuartos en una casa para aumentar el valor por m2?

En propiedades tenemos una variables rooms que describe cuantas habitaciones tiene la propiedad y otra, price_usd_per_m2 donde se dice el precio por m2, en dólares, de la propiedad. Utilizando estas columnas y otras herramientas averigue cuál es la cantidad óptima de cuartos en una casa para optimizar el valor por m2, es decir, para que este valor promedio sea el mayor posible.

propiedades %>%
"summarise(promedio = mean(price_usd_per_m2, na.rm = TRUE))"
grade_result(
  pass_if(~ identical(unlist(.result),
                      unlist(propiedades %>%
                               group_by(rooms) %>% 
                               summarise(promedio = mean(price_usd_per_m2,
                                                         na.rm = TRUE)) %>%
                               arrange(desc(promedio)))),
          "¡Bien hecho!")
)


ixpantia/ixpantia.introR documentation built on Jan. 25, 2024, 2:32 p.m.