Entradas

Mostrando entradas de marzo, 2023

7. Regresión y correlación

Imagen
CORRELACIÓN LINEAL Para estudiar la relación lineal existente entre dos variables continuas es necesario disponer de parámetros que permitan cuantificar dicha relación. Uno de estos parámetros es la covarianza, que indica el grado de variación conjunta de dos variables aleatorias. Covarianza muestral = C o v ( X , Y ) = ∑ n i = 1 ( x i − x ¯ ¯ ¯ ) ( y i − y ¯ ¯ ¯ ) N − 1 siendo  y   la media de cada variable y X i x i  e y i  el valor de las variables para la observación . La covarianza depende de las escalas en que se miden las variables estudiadas, por lo tanto, no es comparable entre distintos pares de variables. Para poder hacer comparaciones se estandariza la covarianza, generando lo que se conoce como coeficientes de correlación. Existen diferentes tipos, de entre los que destacan el coeficiente de Pearson, Rho de Spearman y Tau de Kendall . Todos ellos varían entre +1 y -1. Siendo +1 una correlación positiva perfecta y -1 una correlación negativa perfecta...

6. Cuartiles y percentiles para datos agrupados

Imagen
 PERCENTILES Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las personas cuando atienden características tales como peso, estatura, etc. Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles   muestran la variable que deja detrás una frecuencia acumulada igual al valor del percentil: El percentil 1 supera al uno por ciento de los valores, es decir, indica que sólo existe un 1% de probabilidad de que el valor de la variable esté por debajo de esa cifra. El percentil 60, es aquel valor de la variable que supera al  de las observaciones, es decir, indica que existe un 60% de probabilidad de que el valor de la variable esté por debajo de esa cifra. El percentil 99 supera 99% de los datos, es decir, indica que existe un 99% de probabilidad de qu...