Cada una de las dos variablesx, y de una distribución bidimensional tiene sus propios parámetros. Para el estudio de la correlación se necesitan sus medias, , , y sus desviaciones típicas, σx, σy. Hay además un nuevo parámetro, σxy, llamado covarianza, que sirve para medir el grado de relación entre las dos variables: cómo varía cada una con relación a la otra. La covarianza de una distribución bidimensional de n individuos dados por los pares de valores (x1,y1), (x2,y2),…,(xn,yn), se calcula mediante la fórmula siguiente: La segunda expresión es más cómoda de aplicar cuando las medias , , no son números enteros. El coeficiente de correlación, r, se obtiene dividiendo la covarianza por el producto de las desviaciones típicas: Este parámetro no tiene dimensiones. Por ejemplo, si la variable x es una longitud y la y un peso, los valores y σx son longitudes, y sus valores varían según que los datos estén dados en centímetros, en metros…; los valores de yσy son pesos, y sus valores varían según las unidades en que se expresen los datos; la covarianza, σxy, es el producto de una longitud por un peso, y su valor varía según las unidades en que se den xi, yi; sin embargo, el coeficiente de correlación es un número abstracto cuyo valor no depende de las unidades en que se hallen los valores de las variables. Además, el hecho de que r tome valores entre –1 y 1 (-1 ≤ r ≤ 1) hace que resulte muy cómodo interpretar sus resultados. Por todo ello, r es un parámetro sumamente adecuado para calcular la correlación entre dos variables estadísticas. A continuación, a modo de ejemplo, se realiza el cálculo de los parámetros estadísticos para hallar la correlación de la siguiente distribución dimensional: Se empieza situando los datos de modo que resulte sencillo hallar las columnas xi2, yi2, xiyi: Las sumas de las columnas son: Con estos resultados se obtienen los parámetros del siguiente modo:
Se llama recta de regresión a una recta que marca la tendencia de la nube de puntos. Si la correlación es fuerte (tanto positiva como negativa) y, por tanto, los puntos de la nube están próximos a una recta, ésta es la recta de regresión. Matemáticamente hay dos rectas de regresión, la recta de regresión de Y sobre X y la de X sobre Y. La recta de regresión de Y sobre X es aquella y = ax + b para la cual la suma de los cuadrados de las desviaciones en el sentido de las ordenadas de cada punto a ella es mínima. Al obligar a que Σdi2 = Σ(yi – axi – b)2 sea mínima, se obtiene la ecuación La recta de regresión de X sobre Y es aquella para la cual la suma de los cuadrados de las desviaciones en el sentido de las abscisas de cada punto a ella es mínima. Su ecuación es Las rectas de regresión tienen las siguientes peculiaridades: • Ambas pasan por el punto (,) llamado centro de gravedad de la distribución. • Los valores se llaman coeficientes de regresión de Y sobre X y de X sobre Y, respectivamente. Las pendientes de las rectas de regresión son byx y 1/byx. COMENTARIO : En esta se contemplan valores supuestos que se obtienen al comparar 2 variables obteniendo resultados a partir de una variable ya conocida será 1 en 2 cuando se obtiene la segunda partiendo de la primera y 2 en 1 obteniendo la segunda partir de la primera. |
lunes, 23 de junio de 2008
PARÁMETROS EN UNA DISTRIBUCIÓN BIDIMENSIONAL
Suscribirse a:
Enviar comentarios (Atom)
No hay comentarios:
Publicar un comentario