VALORES ESTANDARIZADOS: Los valores estandarizados dentro del área bajo la curva normal es un proceso principalmente para poder lograr o alcanzar valores y con una distribución poder compararlos como bien es cierto que los valores estandarizados, serán la distancia a la que se encuentra por encima o por debajo de la media. Para poder encontrar el valor estandarizado procedemos a restar la media con la con la variable cuya diferencia dividiremos entre la desviación estándar de la distribución y así podemos encontrar el valor reducido y localizarlo de una forma exacta en la curva normal.
COMENTARIO: con los valores estandarizados se pueden obtener valores mas concretos en la cual le restamos a la media con la variable dada y esa se va a dividir con la desviación estándar además con la misma se obtiene el valor reducido que es Z.
Los valores estandarizados nos sirve también para tener un cálculo más exacto en la curva y se va a poder saber con la siguiente formula
Z= X –X
--------
S
DIAGRAMA DE CAJAS O “BOX PLOT”
Es un gráfico representativo de las distribuciones de un conjunto de datos en cuya construcción se usan cinco medidas descriptivas de los mismos, a saber: mediana, primer cuartil, tercer cuartil, valor máximo y valor mínimo.
¿Qué información muestra? Esta presentación visual, asocia las cinco medidas que suelen trabajarse de forma individual. Presenta al mismo tiempo, información sobre la tendencia central, dispersión y simetría de los datos de estudio. Además, permite identificar con claridad y de forma individual, observaciones que se alejan de manera poco usual del resto de los datos. A estas observaciones se les conoce como valores atípicos.Por su facilidad de construcción e interpretación, permite también comparar a la vez varios grupos de datos sin perder información ni saturarse de ella. Esto ha sido particularmente importante a la hora de escoger esta representación para mostrar la opinión de los estudiantes respecto a la actuación docente a través de las diversas preguntas del instrumento utilizado.
Partes del Boxplot: El nombre original del gráfico introducido por Jhon Tukey en 1977 es Box and whisker plot, es decir, diagrama de caja y bigote. En efecto, el gráfico consiste en un rectángulo (caja) de cuyos lados superiores e inferior se derivan respectivamente, dos segmentos: uno hacia arriba y uno hacia abajo (bigotes).La caja y los bigotes están ubicados paralelos a un eje rotulado, que en este caso está en la escala del 1 al 5 e indica el puntaje obtenido en una pregunta según la opinión de los estudiantes que llenaron el instrumento de opinión.Las partes del Boxplot se identifican como sigue:1.-Límite superior: Es el extremo superior del bigote. sobre la construcción de los límites y los valores atípicos.6.-Valores atípicos: . Pueden representar efectos de causas extrañas, opiniones extremas o en el caso de la tabulación manual, errores de medición o registro.Se colocan en la gráfica con asteriscos (*) o puntos (.) según se alejan menos o más del conjunto de datos. Se utiliza un superíndice numérico para indicar el número de veces que aparece ese dato como atípico. la media aritmética para describir el conjunto de datos.¿Cómo se interpreta? Tenga en cuenta las siguientes consideraciones a la hora de interpretar el boxplot:.-Mientras más larga la caja y los bigotes, más dispersa es la distribución de datos..-La distancia entre las cinco medidas descritas en el boxplot (sin incluir la media aritmética) puede variar, sin embargo, recuerde que la cantidad de elementos entre una y otra es aproximadamente la misma. Entre el límite inferior y Q1 hay igual cantidad de opiniones que de Q1 a la mediana, de ésta a Q3 y de Q3 al límite superior. Se considera aproximado porque pudiera haber valores atípicos, en cuyo caso la cantidad de elementos se ve levemente modificada..-La línea que representa la mediana indica la simetría. Si está relativamente en el centro de la caja la distribución es simétrica. Si por el contrario se acerca al primer o tercer cuartil, la distribución pudiera ser sesgada a la derecha (asimétrica positiva) o sesgada a la izquierda (asimétrica negativa respectivamente. Esto suele suceder cuando las opiniones de los estudiantes tienden a concentrase más hacia un punto de la escala..-La mediana puede inclusive coincidir con los cuartiles o con los límites de los bigotes. Esto sucede cuando se concentran muchos datos en un mismo punto, en este caso, cuando muchos estudiantes opinan igual en determinada pregunta. Pudiera ser este un caso particular de una distribución sesgada o el caso de una distribución muy homogénea..-Las opiniones emitidas como No aplica (N/A) cuando en realidad sí aplica o las opiniones nulas (cuando el estudiante no opina en una pregunta), no son tomadas en cuenta para elaborar el boxplot de esa pregunta. Por esta razón encontrará que en ocasiones no hay igual número de opiniones para todas las preguntas..-Debe estar atento al número de estudiantes que opina en cada pregunta. Lo que pareciera ser dispersión en los resultados, en ocasiones podría deberse a un tamaño de muestra muy pequeño: pocos estudiantes opinaron. Debe ser cauteloso a la hora de interpretar. En estos casos se sugiere remitirse al reporte numérico..-En términos comparativos, procure identificar aquellas preguntas cuyos boxplot parecen diferir del resto. Pudiera con esto encontrar fortalezas o debilidades en su actuación según la opinión de los estudiantes.Se observa una variabilidad muy grande en cuanto a las impresiones que los estudiantes tienen del profesor en los diferentes aspectos de su actuación. Esto se concluye porque no existe una tendencia homogénea en las respuestas por pregunta.Las opiniones son muy homogéneas y positivas en la pregunta 5: Logra comunicarse efectivamente con el estudiante. Este aspecto resalta en la actuación del docente y además todos los estudiantes encuestados coinciden en ello.También se considera muy positiva la impresión que los estudiantes tienen en cuanto a los aspectos que se refieren a las preguntas 2, 6, 9, 12 y 13; salvo un par de opiniones que difieren del resto en las preguntas 2 y 6, las respuestas son homogéneas. Note que estas opiniones separadas son datos atípicos pues se alejan del cuerpo de datos. Note también que por el proceso de mejora que sufren los gráficos presentados en línea, debe remitirse al reporte numérico en la pregunta 2 para verificar el número de respuestas atípicas dado que el símbolo representativo por el momento es ($), mas no así en la 9 pues ya se comentó que el símbolo (¡) se refiere a sólo un dato atípico y en este caso vale “2”.Observe que según la opinión de los estudiantes el aspecto de la pregunta 17: Realiza la entrega y revisión oportuna de los resultados de las evaluaciones revela el puntaje más bajo respecto al resto de las pregunta, lo cual pudiera ser un aspecto a considerar por el docente dado que además el 50% de los estudiantes le otorga el puntaje más bajo. Note que aquí la mediana es “1”, lo que indica que la mitad de las observaciones está allí (no por debajo porque no hay valor más bajo)Note que algunos boxplot no tienen bigotes. En estos casos, como por ejemplo en la pregunta 19, el límite inferior coincide con el Q1 y el límite superior coincide con el Q3. En esta pregunta se evidencia simetría y bastante variabilidad.El resto de las preguntas presentan alta variabilidad por lo que deben leerse cuidadosamente en función del punto donde se concentra la mEsta alta variabilidad indica que la opinión de los estudiantes respecto a los planteamientos es bastante ayor cantidad de información, esto es, viendo la posición de la mediana (véase Simetría).
COMENTARIO: Creo que el diagrama de cajas tambien llamado” BOX PLOT” es aquel en el que damos a conocer la ubicación de algunos datos estadisticos en el cual se nos da a conocer el centro de alejamiento de un valor de otro que es de extremo a extremo. Tambien se utilizan los cuarteles 1 y 3 para verificar la información que se busca sobre la mediana.
CARACTERISTICAS DEL DIAGRAMA DE CAJAS:
Los diagramas de caja proporcionan información completa visual sobre cómo se distribuyen los datos. Pueden ser de gran utilidad como técnica de análisis exploratorio de datos.En un simple gráfico se suministra información sobre la mediana (o media), sobre el 50% y 90% de los datos, sobre la existencia de empresas con ratios atípicos, así como de la simetría de la distribución.
Además se incluye dos barras verticales (Bigotes), los cuales determinan la distancia o rango del 95% de los casos; adicionalmente el procedimiento anexa algunos símbolos representativos de los valores atípicos y extremos. La utilidad de este tipo de gráficos radica en la posibilidad de resumir el comportamiento y las principales medidas de una o varias variables de escala, mediante un solo diagrama.
Esta compuesta o incluye dos bigotes o limites inferiores o superiores a los lados del rectángulo, - Mientras mas larga la caja y los bigotes, mas dispersa es la distribución. - La mediana se presenta por una línea que divide en dos partes iguales de la distribución e indica la simetría. - Puede dibujarse de forma horizontal o vertical. - En los extremos del rectángulo se localizan los cuartiles. - La media puede coincidir con los cuartiles. - La media se representa por un punto dependiendo de la cantidad o valor de la misma. EJEMPLO: