knitr::opts_chunk$set(echo = TRUE, error = TRUE)

Pruebas visuales y Permutación

Pruebas de permutación

  1. La tabla de datos Phillies2009 contiene información de la temporada de baseball 2009 para el equipo de Philadelphia Phillies, en este ejercicio queremos comparar los strikes (StrikeOuts) entre los juegos en casa y de visitante:

a) Realiza un lineup donde cada panel muestre un diagrama de caja y brazos para la variable de interés separando los juegos jugados en casa (home) y los juegos jugados fuera (away). ¿Puedes localizar los datos verdaderos entre los nulos?

b) Calcula el promedio de strikes por juego en cada grupo (donde grupo se define por Location).

c) Realiza una prueba de permutación para la diferencia de las medias. Grafica la distribución de referencia y calcula el valor p de dos colas.

# Lectura de datos
phillies <- read_csv("Phillies2009.csv")

Pruebas pareadas

En este ejemplo buscamos comparar la diferencia entre dos medicinas para dormir. - ID es el identificador de paciente, y medicina_1 y medicina_2 son las horas extras de sueño vs. no usar medicina.
- Examina los datos.

library(tidyverse)

dormir <- sleep %>% 
  pivot_wider(names_from = group, 
              names_prefix = "medicina_",
              values_from = extra)

dormir

La pregunta de interés es si una medicina es mejor que otra para prolongar el sueño. Nótese que en este caso, no tenemos grupos, sino mediciones repetidas.

Valores-p

Cuando usamos simulación para pruebas de permutación, el valor-p de una cola se puede calcular como

$$\hat{P}=(X+1)/(N+1)$$ donde $X$ es el número de estadísticas de prueba remuestreadas que son al menos tan extremas como la observada. Supongamos que el verdadero valor p (si pudiéramos hacer todas las permutaciones de manera exhaustiva) es $p$
̂ - ¿Cuál es la varianza de $\hat{P}$?



tereom/fundamentos documentation built on Aug. 10, 2021, 11:59 a.m.