knitr::opts_chunk$set(echo = FALSE) library(learnr) library(gradethis) library(ggplot2) library(dplyr) library(tidyr) casas_texas <- txhousing %>% mutate(month = as.factor(month)) cities <- c("Austin", "Dallas", "El Paso", "Houston", "Irving", "San Antonio") casas_texas <- casas_texas %>% filter(city %in% cities)
knitr::include_graphics( "https://storage.googleapis.com/datos_cursos/ixpantia_introR/ixpantia_logo.png" )
Para la tareas usaremos el conjunto de datos casas_texas, el cual contiene información sobre la industria de las bienes raíces en Texas, Estados Unidos, del 2000 al 2015. El set de datos contiene 8602 observaciones y 9 variables.
glimpse(casas_texas)
Descripción de las variables
| Variable | Descripción |
| :----------: | :---------------------: |
| city
| Ciudad de Texas |
| year
| Año en estudio |
| month
| Mes en estudio |
| sales
| Número de ventas realizadas |
| volume
| Valor total de las ventas |
| median
| Mediana del precio de las ventas |
| listings
| Número de listados activos |
| inventory
| Tiempo necesario para que se vendan todos los listados activos al paso actual de las ventas |
| date
| Fecha en estudio |
volume
de tal forma que podamos ver su distribucionEn el set de datos casas_texas
hay una variable llamada volume
que
representa el valor total de las ventas realizadas. Usando algunos de los
geoms
de ggplot, grafique esta variable de tal forma que se logre ver su
distribución.
ggplot(casas_texas)
ggplot(casas_texas, aes(volume)) + geom_density() # o también ggplot(casas_texas, aes(volume)) + geom_histogram()
En casas_texas tenemos una variables llamada year
que tiene los años del
2000 al 2015 en que se dieron ests ventas y otra variable, sales
con la
cantidad de ventas hechas en la ciudad a la fecha indicada. Ahora utilice estas
variables para hacer un gráfico que muestres la cantidad de ventas realizadas
para cada año en forma de puntos.
ggplot(casas_texas)
ggplot(casas_texas, aes(x = year, y = sales)) + geom_point()
volume
y sales
En casas_texas
hay una variable que se llama volume
que representa el valor
total de las ventas realizadas y otra llamada sales
que contiene el número de
ventas realizadas. Grafique la relación de estas variables utilizando
geom_smooth
y geom_point
. Utilice el método "lm" y una confianza del 90%.
ggplot(casas_texas)
ggplot(casas_texas, aes(x = sales, y = volume)) + geom_smooth(aes(x = sales, y = volume), method = "lm", level = 0.90) + geom_point()
Para este ejercicio utilizaremos el set de datos casas_texas para que sea visualmente más entendible ya que restringe la cantidad de datos.
La variable listings
del conjunto de datos casas_texas describe la
cantidad de listados activos, además, la variable year
describe el año y la
variable city
, el nombre de la ciudad de Texas en cada caso. Utilizando estas
tres variables obtenga un gráfico que muestre la cantidad de listados por año
para cada una de las ciudades.
ggplot(casas_texas)
ggplot(casas_texas, aes(x = year, y = listings, fill = city)) + geom_col()
En casas_texas la variable city
contempla solamente 6 ciudades de Texas,
además este conjunto de datos tiene una variable llamada listings
que contiene
la cantidad de listados activos. Cree un gráfico de cajas que muestre la
distribución de la variable listings
para cada una de las ciudades.
ggplot(casas_texas)
ggplot(casas_texas) + geom_boxplot(aes(x = city, y = listings))
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.