Curtosis y sesgo estandarizados fuera de rango -2 a +2

Estoy analizando datos a través de una diferencia de medias de muestras independientes, basada en una distribución t de student, con 20 datos para cada tratamiento (son dos tratamientos).
Los valores de sesgo estandarizado y curtosis estandarizada, de uno de los tratamientos, se encuentra fuera del rango -2 a +2, lo que indica que los datos no tienen una distribución normal, por lo que no puedo usar pruebas que consideren desviaciones estándar. He estado leyendo y he encontrado tres soluciones, en distintos sitios, para analizar esos datos:
- Eliminar datos extremos
- Ver que tipo de distribución siguen los datos (lognormal, gama, etc.)
- Comparar medianas (fue la recomendación de statgraphics)
La verdad es que no se como continuar el análisis de los datos, ojalá pudieras orientarme.

1 respuesta

Respuesta
2
Te comento, para comprobar la normalidad mejor que utilices algún contraste como el de la chi-cuadrado de normalidad o el de Kolmogorov-Smirnov de normalidad. Por otro lado, la opción de eliminar datos atípicos es válida, prueba a hacer un diagrama de caja y bigotes y los identificarás claramente. Otra opción es la de realizar un transformación de Cox para conseguir normalidad, el problema es que no recuerdo si Statgraphics la tiene implementada.
La opción que te da Statgraphics de considerar medianas es buena, puesto que la mediana no es sensible respecto a valores atípicos, cosa que si le pasa a ala media.
Para un futuro, te recomiendo que no sigues al pie de la letra las recomendaciones de Statgraphics, puesto que están programadas por defecto y siempre te da el mismo consejo y en cada caso no se podrá aplicar lo mismo, además hay que tener presente que el programa no ha sido programado (valga la redundancia) por estadísticos, si no por personas que se han limitado a implementar fucniones y métodos (lo mismo que le ocurre al programa preciado por tantos SPSS, a mi no me gusta, muchas fucniones no son fáciles de implementar o son versiones de técnicas que no funcionan bien o están mal implementadas).
En cuanto a lo de comprobar el tipo de distribución es una opción, tendrás que hacerle un análisis exhaustivo de los datos para comprobar que distribución puede ajustarse y en tal caso realizar el contraste pertinente, los que te he dicho antes sirven pero no tienen que ser de Normalidad. La gran ventaja que presenta esta opción es que tu mismo puedes crear tu contraste específico para datos que siguen dicha distribución. El problema que tiene que tienes que manejar muchas herramientas estadísticas, el contraste de razón de verosimilitudes da buenos resultados, para esto.
Bueno cualquier duda, ya sabes.
Hola Nigihayami,
gracias por responder tan rápidamente.
Te cuento que considere dos alternativas:
Primero, hice una comparación de las medianas, en donde me da como resultado que se rechaza la hipótesis nula.
Segundo, hice el gráfico de caja y bigotes para identificar los valores extremos y los eliminé (quedando así la curtosis y sesgo estandarizado dentro del rango de normalidad). Luego hice el análisis de comparación de medias y me dio como resultado que también se rechaza la hipótesis nula, pero para ese se supone que las desviaciones estándar iguales. Hice una comparación de desv. est. y me da como resultado que son distintas con un 5% de probabilidad de error.
Hice las dos alternativas para asegurarme del resultado, pero me parece que no puedo comparar medias cuando tengo desv. est. distintas. ¿Me podría quedar solo con la primera alternativa (la de comparar medianas) o es necesario hacer un análisis más profundo?
Gracias nuevamente y saludos
El análisis más profundo depende de las necesidades que se tenga, y la importancia de la decisión que se tenga que tomar derivada del test. Te comento, a la hora de realizar un contraste de hipótesis lo primero se tiene que verificar que se verifican ciertas hipótesis de partida, en el caso del contraste de igualdad de medias, se tiene que verificar la normalidad de los datos(mediante test chi-cuadrado, test K-S, Test Jarque-Bera, qq-plot, histograma, diagrama de caja, etc) además se tiene que verificar la independencia de las dos varaibles esto también lo puedes hacer con el contraste de independencia de la chi-cuadrado o K-S. Por otro lado, cuando vamos a comparar medias necesitamos saber si las varianzas poblacionales son conocidas o desconocidas (rara vez son conocidas) ya que esto influye en la distribución asintótica del estadístico de contraste, además también debemos ver si las varianzas son iguales o distintas, para ambas alternativas existe un contraste específico, en el caso de varianzas desconocidas y distintas que es el tuyo se conoce como el problema de Behrens - Fisher, debido a la aproximación de la distribución asintótica del estadístico de contraste, y su solución o mejor dicho aproximación es la aproximación de Welch.
Así que sí tienes un contraste para tu caso, y recuerda para contrastar medias primero se contrastes varianzas para saber si son iguales.
Ahora un comentario que realizarte, ¿cuándo has eliminado los datos los has eliminado todos a la vez? ¿O de uno en uno y comprobando la normalidad cada vez que eliminabas uno?
Te lo digo porque en las poblaciones normales dentro del intervalo [-2,2] se encuentra el 95,4499% de los datos, es decir el porcentaje restante pueden estar fuera de ese rango, así que si tienes algún dato fuera de ese rango neceariamente no tiene porque ser un dato atípico.
Bueno, ya sabes aquí estoy

Añade tu respuesta

Haz clic para o

Más respuestas relacionadas