lunes, 23 de junio de 2008

PARÁMETROS EN UNA DISTRIBUCIÓN BIDIMENSIONAL


 

Cada una de las dos variablesx, y de una distribución bidimensional tiene sus propios parámetros. Para el estudio de la correlación se necesitan sus medias, , , y sus desviaciones típicas, σx, σy.

Hay además un nuevo parámetro, σxy, llamado covarianza, que sirve para medir el grado de relación entre las dos variables: cómo varía cada una con relación a la otra.

La covarianza de una distribución bidimensional de n individuos dados por los pares de valores (x1,y1), (x2,y2),…,(xn,yn), se calcula mediante la fórmula siguiente: 


La segunda expresión es más cómoda de aplicar cuando las medias , , no son números enteros.

El coeficiente de correlación, r, se obtiene dividiendo la covarianza por el producto de las desviaciones típicas: 

Este parámetro no tiene dimensiones. Por ejemplo, si la variable x es una longitud y la y un peso, los valores y σx son longitudes, y sus valores varían según que los datos estén dados en centímetros, en metros…; los valores de yσy son pesos, y sus valores varían según las unidades en que se expresen los datos; la covarianza, σxy, es el producto de una longitud por un peso, y su valor varía según las unidades en que se den xi, yi; sin embargo, el coeficiente de correlación es un número abstracto cuyo valor no depende de las unidades en que se hallen los valores de las variables. Además, el hecho de que r tome valores entre –1 y 1 (-1 ≤ r ≤ 1) hace que resulte muy cómodo interpretar sus resultados. Por todo ello, r es un parámetro sumamente adecuado para calcular la correlación entre dos variables estadísticas.

A continuación, a modo de ejemplo, se realiza el cálculo de los parámetros estadísticos para hallar la correlación de la siguiente distribución dimensional: 


Se empieza situando los datos de modo que resulte sencillo hallar las columnas xi2, yi2, xiyi



Las sumas de las columnas son:

Σxi = 26 ; Σyi = 31 ;
Σxi2 = 158 ; Σyi2 = 213 ;
Σxiyi = 176

Con estos resultados se obtienen los parámetros del siguiente modo: 


 

 


                                   REGRESIÓN


Se llama recta de regresión a una recta que marca la tendencia de la nube de puntos. Si la correlación es fuerte (tanto positiva como negativa) y, por tanto, los puntos de la nube están próximos a una recta, ésta es la recta de regresión.

Matemáticamente hay dos rectas de regresión, la recta de regresión de Y sobre X y la de X sobre Y.

La recta de regresión de Y sobre X es aquella = ax b para la cual la suma de los cuadrados de las desviaciones en el sentido de las ordenadas de cada punto a ella es mínima. 



Al obligar a que Σdi2 = Σ(yi – axi – b)2 sea mínima, se obtiene la ecuación 

La recta de regresión de X sobre Y es aquella para la cual la suma de los cuadrados de las desviaciones en el sentido de las abscisas de cada punto a ella es mínima. 



Su ecuación es 



Las rectas de regresión tienen las siguientes peculiaridades:

• Ambas pasan por el punto (,) llamado centro de gravedad de la distribución. 
• Los valores 




se llaman coeficientes de regresión de Y sobre X y de X sobre Y, respectivamente. Las pendientes de las rectas de regresión son byx y 1/byx.
• Cuando la correlación es fuerte, las dos rectas de regresión son muy próximas (son la misma si
r = ±1). Si la correlación es débil, las dos rectas de regresión forman un ángulo grande.
• Cuando |
r| es próximo a 1 la recta de regresión sirve para realizar estimaciones fiables de una de las variables para nuevos valores de la otra variable. 


 

COMENTARIO :

 

En esta se contemplan valores supuestos que se obtienen  al comparar 2 variables obteniendo resultados a partir de una variable ya conocida será 1 en 2 cuando se obtiene la segunda partiendo de la primera y 2 en 1 obteniendo la segunda partir de la primera.



   

No hay comentarios: