knitr::opts_chunk$set(echo = FALSE)

library(learnr)
library(gradethis)
library(ggplot2)
library(dplyr)
library(tidyr)

casas_texas <- txhousing %>% 
  mutate(month = as.factor(month))

cities <- c("Austin", "Dallas", "El Paso", "Houston", "Irving", "San Antonio")

casas_texas <- casas_texas %>% 
  filter(city %in% cities)
knitr::include_graphics(
  "https://storage.googleapis.com/datos_cursos/ixpantia_introR/ixpantia_logo.png"
  )    

Datos: casas_texas

Para la tareas usaremos el conjunto de datos casas_texas, el cual contiene información sobre la industria de las bienes raíces en Texas, Estados Unidos, del 2000 al 2015. El set de datos contiene 8602 observaciones y 9 variables.

glimpse(casas_texas)

Descripción de las variables

| Variable | Descripción | | :----------: | :---------------------: | | city | Ciudad de Texas | | year | Año en estudio | | month | Mes en estudio | | sales | Número de ventas realizadas | | volume | Valor total de las ventas | | median | Mediana del precio de las ventas | | listings | Número de listados activos | | inventory | Tiempo necesario para que se vendan todos los listados activos al paso actual de las ventas | | date | Fecha en estudio |

Ejercicios

1. Grafique la variable volume de tal forma que podamos ver su distribucion

En el set de datos casas_texas hay una variable llamada volume que representa el valor total de las ventas realizadas. Usando algunos de los geoms de ggplot, grafique esta variable de tal forma que se logre ver su distribución.

ggplot(casas_texas)
ggplot(casas_texas, aes(volume)) +
  geom_density()

# o también

ggplot(casas_texas, aes(volume)) +
  geom_histogram()

2. Cree un gráfico de puntos sencillo que represente la cantidad de ventas sobre los años

En casas_texas tenemos una variables llamada year que tiene los años del 2000 al 2015 en que se dieron ests ventas y otra variable, sales con la cantidad de ventas hechas en la ciudad a la fecha indicada. Ahora utilice estas variables para hacer un gráfico que muestres la cantidad de ventas realizadas para cada año en forma de puntos.

ggplot(casas_texas)
ggplot(casas_texas, aes(x = year, y = sales)) +
  geom_point()

3. Cree un gráfico que permita ver la relación entre volume y sales

En casas_texas hay una variable que se llama volume que representa el valor total de las ventas realizadas y otra llamada sales que contiene el número de ventas realizadas. Grafique la relación de estas variables utilizando geom_smooth y geom_point. Utilice el método "lm" y una confianza del 90%.

ggplot(casas_texas)
ggplot(casas_texas, aes(x = sales, y = volume)) +
  geom_smooth(aes(x = sales, y = volume), 
              method = "lm", level = 0.90) +
  geom_point() 

4. Haga un gráfico que muestre la cantidad de listados por año para cada ciudad

Para este ejercicio utilizaremos el set de datos casas_texas para que sea visualmente más entendible ya que restringe la cantidad de datos.

La variable listings del conjunto de datos casas_texas describe la cantidad de listados activos, además, la variable year describe el año y la variable city, el nombre de la ciudad de Texas en cada caso. Utilizando estas tres variables obtenga un gráfico que muestre la cantidad de listados por año para cada una de las ciudades.

ggplot(casas_texas)
ggplot(casas_texas, aes(x = year, y = listings, fill = city)) +
  geom_col()

5. Haga un gráfico de cajas para las 6 ciudades de casas_texas según su cantidad de listados activos

En casas_texas la variable city contempla solamente 6 ciudades de Texas, además este conjunto de datos tiene una variable llamada listings que contiene la cantidad de listados activos. Cree un gráfico de cajas que muestre la distribución de la variable listings para cada una de las ciudades.

ggplot(casas_texas)
ggplot(casas_texas) +
  geom_boxplot(aes(x = city, y = listings))


ixpantia/ixpantia.introR documentation built on Jan. 25, 2024, 2:32 p.m.