ESTADISTICA 5to. PAE "A": PARÁMETROS EN UNA DISTRIBUCIÓN BIDIMENSIONAL

Cada una de las dos variablesx, y de una distribución bidimensional tiene sus propios parámetros. Para el estudio de la correlación se necesitan sus medias, , , y sus desviaciones típicas, σ_x, σ_y.

Hay además un nuevo parámetro, σ_xy, llamado covarianza, que sirve para medir el grado de relación entre las dos variables: cómo varía cada una con relación a la otra.

La covarianza de una distribución bidimensional de n individuos dados por los pares de valores (x₁,y₁), (x₂,y₂),…,(x_n,y_n), se calcula mediante la fórmula siguiente:

La segunda expresión es más cómoda de aplicar cuando las medias , , no son números enteros.

El coeficiente de correlación, r, se obtiene dividiendo la covarianza por el producto de las desviaciones típicas:

Este parámetro no tiene dimensiones. Por ejemplo, si la variable x es una longitud y la y un peso, los valores  y σ_x son longitudes, y sus valores varían según que los datos estén dados en centímetros, en metros…; los valores de  yσ_y son pesos, y sus valores varían según las unidades en que se expresen los datos; la covarianza, σ_xy, es el producto de una longitud por un peso, y su valor varía según las unidades en que se den x_i, y_i; sin embargo, el coeficiente de correlación es un número abstracto cuyo valor no depende de las unidades en que se hallen los valores de las variables. Además, el hecho de que r tome valores entre –1 y 1 (-1 ≤ r ≤ 1) hace que resulte muy cómodo interpretar sus resultados. Por todo ello, r es un parámetro sumamente adecuado para calcular la correlación entre dos variables estadísticas.

A continuación, a modo de ejemplo, se realiza el cálculo de los parámetros estadísticos para hallar la correlación de la siguiente distribución dimensional:

Se empieza situando los datos de modo que resulte sencillo hallar las columnas x_i², y_i², x_iy_i:

Las sumas de las columnas son:

Σx_i = 26 ; Σy_i = 31 ;
Σx_i² = 158 ; Σy_i² = 213 ;
Σx_iy_i = 176

Con estos resultados se obtienen los parámetros del siguiente modo:

REGRESIÓN

Se llama recta de regresión a una recta que marca la tendencia de la nube de puntos. Si la correlación es fuerte (tanto positiva como negativa) y, por tanto, los puntos de la nube están próximos a una recta, ésta es la recta de regresión.

Matemáticamente hay dos rectas de regresión, la recta de regresión de Y sobre X y la de X sobre Y.

La recta de regresión de Y sobre X es aquella y = ax + b para la cual la suma de los cuadrados de las desviaciones en el sentido de las ordenadas de cada punto a ella es mínima.

Al obligar a que Σd_i² = Σ(y_i – ax_i – b)² sea mínima, se obtiene la ecuación

La recta de regresión de X sobre Y es aquella para la cual la suma de los cuadrados de las desviaciones en el sentido de las abscisas de cada punto a ella es mínima.

Su ecuación es

Las rectas de regresión tienen las siguientes peculiaridades:

• Ambas pasan por el punto (,) llamado centro de gravedad de la distribución.

• Los valores

se llaman coeficientes de regresión de Y sobre X y de X sobre Y, respectivamente. Las pendientes de las rectas de regresión son b_yxy 1/b_yx.
• Cuando la correlación es fuerte, las dos rectas de regresión son muy próximas (son la misma si r = ±1). Si la correlación es débil, las dos rectas de regresión forman un ángulo grande.
• Cuando |r| es próximo a 1 la recta de regresión sirve para realizar estimaciones fiables de una de las variables para nuevos valores de la otra variable.

COMENTARIO :

En esta se contemplan valores supuestos que se obtienen al comparar 2 variables obteniendo resultados a partir de una variable ya conocida será 1 en 2 cuando se obtiene la segunda partiendo de la primera y 2 en 1 obteniendo la segunda partir de la primera.

ESTADISTICA 5to. PAE "A"

lunes, 23 de junio de 2008

PARÁMETROS EN UNA DISTRIBUCIÓN BIDIMENSIONAL

No hay comentarios:

Archivo del blog

Datos personales