Tarea evaluable T2
Unos investigadores desarrollan un nuevo entorno virtual de aprendizaje basado en Google Apps. Para evaluar la incidencia de la utilización de este nuevo entorno en las calificaciones de los estudiantes, durante dos años (2016 y 2017) se realiza un estudio de caso con dos grupos de estudiantes: un grupo de control que utiliza Moodle y un grupo experimental que utiliza Google Apps.
El registro del caso se recoge en los siguientes ficheros:
SE PIDE: realizar los ejercicios 1 y 3 y reproducir los ejercicios 2 y 4. 1.- Para cada uno de los años, analizar si existen diferencias estadísticamente significativas entre las calificaciones de ambos grupos. ¿Cómo presentarías los resultados en un artículo científico? 2.- Crear una nueva variable de datos (data frame) que agrupe la información de los dos ficheros.
SOLUCIÓN:
Primero añadimos una nueva columna ("anio") en el data frame correspondiente a cada año:
> Notas_2grupos_v1["anio"] <- "2016"
> Notas_2grupos_v2["anio"] <- "2017"
A continuación, creamos el nuevo data frame: > new_data_frame <- rbind(Notas_2grupos_v1, Notas_2grupos_v2)
Visualizar el contenido de la nueva variable. 3.- Partiendo de la nueva variable, analizar si existen diferencias estadísticamente significativas entre las calificaciones de ambos años, teniendo en cuenta que, en este caso, la comparación se realiza sobre muestras dependientes (dos observaciones sobre los mismos sujetos: una en 2016 y otra en 2017). ¿Qué opción hay que añadir al comando "t.test()" para tener en cuenta este aspecto? 4.- Comprobar que los datos siguen una distribución normal (https://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal). SOLUCIÓN: Calculamos las diferencias entre las calificaciones de uno y otro año. > diferencias = datos2017$nota - datos2016$nota
Representamos los datos en una figura. En este caso, omitiremos la coordenada X de los datos, por lo que la función "plot()" coge el índice del dato dentro del vector como abcisa: > plot(diferencias, ylab="diferencias (2017-2016)")
> abline(0,0, col="blue", lwd=2)
Para completar la figura, añadiremos una etiqueta a cada punto. Como el comando "textxy()" que permite hacer esto no está disponible por defecto en R, antes deberemos bajar el módulo, paquete o librería "calibrate" que incluye dicho comando e instalar la librería (conclusión: la funcionalidad básica de R se puede extender gracias a paquetes de terceros): > install.packages("calibrate")
> library(calibrate)
> textxy(as.numeric(row.names(datos2016)), diferencias, datos2016$sujeto, cex=0.5, offset=0.6)
A continuación, representamos el histograma de las diferencias: > hist(diferencias, col="gray", main="histograma", xlab="diferencias")
A partir de la información mostrada en el histograma, ¿afirmarías que los datos siguen una distribución normal? Vamos a comprobarlo formalmente. Representamos la función de densidad de las diferencias: > plot(density(diferencias))
Sobre esta figura, superponemos una curva representando una función de densidad normal con la media y la desviación estandar de los datos de diferencias: > m <- mean(diferencias)
> std <- sqrt(var(diferencias))
> curve(dnorm(x, mean=m, sd=std), col="darkblue", lwd=2, add=TRUE)
NOTA: durante la realización de los ejercicios, se recomienda consultar la documentación acerca de cada comando. QUÉ HAY QUE ENTREGAR: el estudiante publicará un post en su blog en el que indicará, de forma detallada, el proceso seguido para realizar el análisis (los comandos introducidos, las gráficas obtenidas, etc.) y justificará los resultados de forma razonada. FECHA DE ENTREGA: la fecha límite de entrega es el 8 de marzo de 2018 coincidente con la señalada en [BT01-BT02] Tarea evaluable T1. Memoria del Proceso Formativo |
martes, 30 de enero de 2018
[BT01-BT02] Tarea evaluable T2. Introducción a R
Esta Tarea evaluable T2 se relaciona con lo visto en clase y recogido en [BT01-BT02] Introducción a R.
Suscribirse a:
Enviar comentarios (Atom)
No hay comentarios:
Publicar un comentario