#Ejemplo ciclistas ANOVA ######################################################## # Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan # con metodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, # el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja # en el gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. # Despues de un mes de entrenamiento se realiza un test de rendimiento consistente # en un recorrido cronometrado de 9 Km. Los tiempos empleados (en minutos) # fueron los siguientes # # Metodo # 1 2 3 # ------------ # 15 14 13 # 16 13 12 # 14 15 11 # 15 16 14 # 17 14 11 ##################################################### # Cargamos los datos al R #################################################### tiempos=c(15,16,14,15,17,14,13,15,16,14,13,12,11,14,11) # grupos metodo = as.factor(c(rep("metodo 1",5),rep("metodo 2",5),rep("metodo 3",5))) boxplot(tiempos~metodo) # calculemos las medias muestrales, desvios muestrales y varianzas # muestrales por grupos aggregate(x=tiempos,by=list(metodo),FUN="mean") aggregate(x=tiempos,by=list(metodo),FUN="sd") aggregate(x=tiempos,by=list(metodo),FUN="var") # calculemos la media muestral, desvios muestral y varianza # muestral de todas las observaciones mean(tiempos) sd(tiempos) var(tiempos) ################################################### # Ajustamos el modelo de ANOVA ################################################### modelo = aov(tiempos~metodo) summary(modelo) # Que pasa si hubieramos comparado solo los primeros dos grupos # con el test de t? modelo2 = aov(tiempos[1:10]~metodo[1:10]) summary(modelo2) testt<-t.test(tiempos[1:5],tiempos[6:10],var.equal = T) testt$statistic (testt$statistic)^2 #coincide con que valor? testt$p.value #coincide con cual? # calculamos el estimador de la varianza a partir de las # tres varianzas muestrales por grupos (SS_W) 1.3*4+1.3*4+1.7*4 #O bien, var(modelo$residuals)*14 # SS_B (1.4^2+0.4^2+1.8^2)*5 # Testee la igualdad de los tiempos medios de los 3 metodos de entrenamiento con nivel 5 %. # Escriba las hipotesis del test, defina el estadistico involucrado, de su distribucion bajo H0 y escriba la # conclusion del mismo en los terminos del problema. Plantee como calcular el p-valor. I<-3 N<-15 alfa<-0.05 cuantil<-qf(0.95,df1 = (I-1),df2 = (N-I)) # pvalor 1-pf(9.349,df1 = (I-1),df2 = (N-I)) # Indique, si los hay, que tratamientos son diferentes y cuales son estadisticamente equivalentes. # Como deportista, cual(/es) metodo(/s) de entrenamiento elegiria ? # Comparaciones multiples: library(multcomp) # Tukey T = glht(modelo, linfct = mcp(metodo ="Tukey")) summary(T) plot(T) # Bonferroni summary(T, test = adjusted("bonferroni")) plot(T,test = adjusted("bonferroni")) library("asbio") int.bonf<-pairw.anova(y = tiempos, x = metodo, method = "bonf") plot(int.bonf,type="2",las=1) int.tukey<-pairw.anova(y = tiempos, x = metodo, method = "tukey") plot(int.tukey,type="2",las=1) int.bonf int.tukey ######################################################################### # Que supuestos se consideraron para que sea valido el ajuste al modelo realizado? Analice la # validez de los mismoS # Analisis de los residuos: par(mfrow = c(2,2)) plot(modelo) library(lawstat) levene.test(tiempos,metodo) bartlett.test(tiempos~metodo) shapiro.test(modelo$residuals) ##########################################################################################333