martes, 24 de junio de 2008

 Series de Tiempo

Una serie temporal o cronológica es un conjunto e observaciones de una variable, ordenadas según transcurre el tiempo.

En una serie de tiempo las observaciones no se deben ordenar de mayor a menor debido a que se perdería el grueso de la información debido a que nos interesa detectar como se mueve la variable en el tiempo es muy importante respetar la secuencia temporal de las observaciones.

 Representación de una Serie Temporal

Par realizar la representación de una serie y temporal se debe realiza mediante una gráfica de dispersión x-y como se muestra en la figura.



 Componetes de una serie temporal

 Tendencia

La tendencia es un movimiento de larga duración que muestra la evolución general de la serie en el tiempo.

La tendencia es un movimiento que puede ser estacionario o ascendente, y su recorrido, una línea recta o una curva. Algunas de las posibles formas son las que se muestran a continuación.

Fig.2. Representación de la tendencia

La tendencia es un movimiento que puede ser estacionario o ascendente o descendente como se indica.

Fig. 3 Tendencias ascendente, estacionaria y descendente

También son posibles algunas formas para la tendencia, que no necesariamente tiene una distribución de puntos en forma aproximadamente lineal sino como las que se muestran en la figura.



 Variaciones estacionales.

Se habla de este tipo de variaciones usualmente cuando el comportamiento de la variable en el tiempo en un periodo esta relacionado con la época o un periodo particular, por lo general en el espacio cronológico presente.



 Variaciones cíclicas

Se llama así a las oscilaciones a lo largo de una tendencia con un periodo superior al año. El ciclo sugiere la idea de que este tipo de movimiento se repite cada cierto periodo con característica parecida. Los ejemplos mas frecuentes se encuentran en le campo de las variables económicas, en estos casos se deben principalmente a la alternancia de las etapas de prosperidad y depresión en la actividad económica.

 

 Variaciones residuales

Cuando a parecen hechos imprevistos, repentinos que afecten las variables en estudio que no podemos proveer nos hallamos frente a variaciones residuales provocadas peores factores externas a aleatorios.

Por ejemplo un día lluvioso y frio durante los veranos es difícil de predecir y aunque perturbaría ciertas actividades diarias como la venta de helados no afectaría en este caso significativamente la serie.

COMENTARIO

En las series de tiempo nos podemos dar cuenta que consta de varias clases de series ya se crecientes o decrecientes, estacionarias y no estacionarias.

lunes, 23 de junio de 2008

PARÁMETROS EN UNA DISTRIBUCIÓN BIDIMENSIONAL


 

Cada una de las dos variablesx, y de una distribución bidimensional tiene sus propios parámetros. Para el estudio de la correlación se necesitan sus medias, , , y sus desviaciones típicas, σx, σy.

Hay además un nuevo parámetro, σxy, llamado covarianza, que sirve para medir el grado de relación entre las dos variables: cómo varía cada una con relación a la otra.

La covarianza de una distribución bidimensional de n individuos dados por los pares de valores (x1,y1), (x2,y2),…,(xn,yn), se calcula mediante la fórmula siguiente: 


La segunda expresión es más cómoda de aplicar cuando las medias , , no son números enteros.

El coeficiente de correlación, r, se obtiene dividiendo la covarianza por el producto de las desviaciones típicas: 

Este parámetro no tiene dimensiones. Por ejemplo, si la variable x es una longitud y la y un peso, los valores y σx son longitudes, y sus valores varían según que los datos estén dados en centímetros, en metros…; los valores de yσy son pesos, y sus valores varían según las unidades en que se expresen los datos; la covarianza, σxy, es el producto de una longitud por un peso, y su valor varía según las unidades en que se den xi, yi; sin embargo, el coeficiente de correlación es un número abstracto cuyo valor no depende de las unidades en que se hallen los valores de las variables. Además, el hecho de que r tome valores entre –1 y 1 (-1 ≤ r ≤ 1) hace que resulte muy cómodo interpretar sus resultados. Por todo ello, r es un parámetro sumamente adecuado para calcular la correlación entre dos variables estadísticas.

A continuación, a modo de ejemplo, se realiza el cálculo de los parámetros estadísticos para hallar la correlación de la siguiente distribución dimensional: 


Se empieza situando los datos de modo que resulte sencillo hallar las columnas xi2, yi2, xiyi



Las sumas de las columnas son:

Σxi = 26 ; Σyi = 31 ;
Σxi2 = 158 ; Σyi2 = 213 ;
Σxiyi = 176

Con estos resultados se obtienen los parámetros del siguiente modo: 


 

 


                                   REGRESIÓN


Se llama recta de regresión a una recta que marca la tendencia de la nube de puntos. Si la correlación es fuerte (tanto positiva como negativa) y, por tanto, los puntos de la nube están próximos a una recta, ésta es la recta de regresión.

Matemáticamente hay dos rectas de regresión, la recta de regresión de Y sobre X y la de X sobre Y.

La recta de regresión de Y sobre X es aquella = ax b para la cual la suma de los cuadrados de las desviaciones en el sentido de las ordenadas de cada punto a ella es mínima. 



Al obligar a que Σdi2 = Σ(yi – axi – b)2 sea mínima, se obtiene la ecuación 

La recta de regresión de X sobre Y es aquella para la cual la suma de los cuadrados de las desviaciones en el sentido de las abscisas de cada punto a ella es mínima. 



Su ecuación es 



Las rectas de regresión tienen las siguientes peculiaridades:

• Ambas pasan por el punto (,) llamado centro de gravedad de la distribución. 
• Los valores 




se llaman coeficientes de regresión de Y sobre X y de X sobre Y, respectivamente. Las pendientes de las rectas de regresión son byx y 1/byx.
• Cuando la correlación es fuerte, las dos rectas de regresión son muy próximas (son la misma si
r = ±1). Si la correlación es débil, las dos rectas de regresión forman un ángulo grande.
• Cuando |
r| es próximo a 1 la recta de regresión sirve para realizar estimaciones fiables de una de las variables para nuevos valores de la otra variable. 


 

COMENTARIO :

 

En esta se contemplan valores supuestos que se obtienen  al comparar 2 variables obteniendo resultados a partir de una variable ya conocida será 1 en 2 cuando se obtiene la segunda partiendo de la primera y 2 en 1 obteniendo la segunda partir de la primera.



   

viernes, 20 de junio de 2008

Distribución bidimensional

Distribución bidimensional, distribución estadística en la que intervienen dos variables, x e y, y, por tanto, a cada individuo le corresponden dos valores, xi, yi. Estos dos valores se pueden considerar como coordenadas de un punto (xi, yi) representado en un diagrama cartesiano. Así, a cada individuo de la distribución le corresponderá un punto, y toda la distribución se verá representada mediante un conjunto de puntos.

Por ejemplo, supongamos que si a los cinco hijos, A, B, C, D y E, de una familia se les pasan unas pruebas que miden la aptitud musical (Mu) y la aptitud para las matemáticas (Ma), se obtienen los siguientes resultados: 


Esta tabla es una distribución bidimensional porque intervienen dos variables: valoración Mu, valoración Ma. A cada individuo le corresponden dos valores: A(5,6), B(7,10), C(4,5), D(8,6), E(2,4). De este modo se asocia a cada individuo un punto en un diagrama cartesiano: 


CORREALCION:

Esta representación gráfica de una distribución bidimensional se llama nube de puntos o diagr Correlación, en estadística, relación entre las dos variables de una distribución bidimensional. Se mide mediante el coeficiente de correlación, r.

Si los datos de la distribución son (x1,y1), (x2,y2),…, (xn,yn), el coeficiente de correlación se obtiene mediante la fórmula: 



en donde σxy es la covarianza, y σ x, σ y son las desviaciones típicas de las dos variables.

El valor del coeficiente de correlación oscila entre –1 y 1 (-1 ≤ r ≤ 1). En cada caso concreto, el valor de r indica el tipo de relación entre las variables x e y.

Cuando |r|es próximo a 1, la correlación es fuerte, lo que significa que las variaciones de una de las variables repercuten fuertemente en la otra. Mientras que si |r|es próximo a 0, la correlación es muy débil y las variables están muy poco relacionadas.ama de dispersión.

Entre las dos variables que determinan una distribución bidimensional puede existir una relación más o menos estrecha que se llama correlación, y se puede medir mediante el coeficiente de correlación, r, que es un número, asociado a los valores de las dos variables. El coeficiente de correlación puede valer entre -1 y 1.

Cuando r = 1 existe una relación funcional entre las dos variables de modo que el valor de cada variable se puede obtener a partir de la otra. Los puntos de la nube están todos situados sobre una recta de pendiente positiva. 


Esto ocurre, por ejemplo, cuando una barra metálica se somete a distintas temperaturas, x1, x2,…, xn, y se miden con precisión sus correspondientes longitudes, y1, y2,…, yn. Las longitudes se obtienen funcionalmente a partir de las temperaturas de modo que, conociendo la temperatura a que se va a calentar, se podría obtener la longitud que tendría la barra.

Cuando r es positivo y grande (próximo a 1) se dice que hay una correlación fuerte y positiva. Los valores de cada variable tienden a aumentar cuando aumentan los de la otra. Los puntos de la nube se sitúan próximos a una recta de pendiente positiva. 



Es el caso de las estaturas, x1, x2,…, xn, y los pesos, y1,y2,…, yn, de diversos atletas de una misma especialidad. A mayor estatura cabe esperar que tengan mayor peso, pero puede haber excepciones.

Cuando r es próximo a cero (por ejemplo, r = -0,12 o r = 0,08) se dice que la correlación es muy débil (prácticamente no hay correlación). La nube de puntos es amorfa. 



Es lo que ocurriría si lanzáramos simultáneamente dos dados y anotáramos sus resultados: puntuación del dado rojo, xi; puntuación del dado verde, yi. No existe ninguna relación entre las puntuaciones de los dados en las diversas tiradas.

Cuando r es próximo a -1 (por ejemplo, r = -0,93) se dice que hay una correlación fuerte y negativa. Los valores de cada variable tienden a disminuir cuando aumentan los de la otra. Los puntos de la nube están próximos a una recta de pendiente negativa



Si en un conjunto de países en vías de desarrollo se miden sus rentas per cápita, xi, y sus índices de natalidad, yi, se obtiene una distribución de este tipo, pues suele ocurrir que, grosso modo, cuanto mayor sea la renta per cápita menor será el índice de natalidad.

Cuando r = -1 todos los puntos de la recta están sobre una recta de pendiente negativa. Existe una relación funcional entre las dos variables. 


 

COMENTARIO

 

Es muy importante en el presente curso pues en ella se puede encontrar la igualdad que existe en dos variables de un mismo fenómeno si se encuentran  dispersos las dos en forma lineal sera una correlacion lineal y dicha linea es imaginaria.