La simulación ha mostrado ser un instrumento eficaz para contrastar la bondad de estadísticos de uso frecuente en la investigación psicológica, comprobándose cómo se comportan frente a la violación de los supuestos subyacentes.
En investigaciones anteriores (Borges, San Luis y Sánchez-Bruno, 1993; Borges, 1994; Borges, Sánchez-Bruno y Cañadas, 1996; Sánchez-Bruno y Borges, 1997; Cañadas y cols., en prensa) hemos estudiado la violación de los supuestos de normalidad y de homocedasticidad para dos grupos, en contrastes paramétricos y no paramétricos, llegando a la conclusión de que la heterocedasticidad combinada con violaciones de la normalidad, produce resultados devastadores con contrastes al uso, tanto paramétricos (t de Student, contraste de Welch) como no paramétricos (U de Mann-Withney).
Siguiendo con esa línea, en la presente investigación estudiamos el comportamiento del contraste de t de Student con medias recortadas (Wilcox, 1996), con tamaños grupales pequeños, bajo la violación de los supuestos de normalidad y homocedasticidad, puesto que este contraste ha mostrado ser de utilidad en situaciones dónde los tamaños grupales son desiguales y las distribuciones son asimétricas (Wilcox, 1994; Keller-McnNulty y Higgins, 1987).
Metodología
La metodología seguida ha sido la simulación de muestras, utilizando 10.000 replicaciones.
Se ha estudiado la robustez del contraste y su potencia, estimados mediante la proporción de rechazos de la hipótesis nula, con cuatro tamaños de efecto: nulo (para el estudio de la robustez), pequeño, mediano y grande.
Para la definición del tamaño de efecto, d, se siguió a Cohen (1988), de forma que d queda definido:

Siendo los valores de d 0, 0.2, 0.5 y 0.8. Puesto que las puntuaciones
se generan estandarizadas, en principio 1
= 2 = 0 y σ = 1,
por lo que para obtener el tamaño de efecto deseado, d se añade
directamente a 2.
Se han tomado las siguientes condiciones experimentales: tamaño de cada grupo (5, 10, 15, 20, 25 y 30), varianzas iguales o distintas (1:1; 1:3; 3:1) y forma de la distribución:
- Asimetría, con los siguientes valores: -2, -1, 0, 1 y 2 (todos ellos con un coeficiente de apuntamiento de 5,25). Estos valores se combinaron entre sí de todas las formas posibles.
- Apuntamiento, con los siguientes niveles: normal, leptocúrtico (con coeficiente 5,25) y platicúrtico (con coeficiente -1,15 que es, prácticamente, una distribución uniforme), todos ellos con coeficiente de asimetría 0 y combinados entre sí de la siguiente forma: nn, ll, pp, nl, np, pl.
Para el cálculo de las medias recortadas se sigue el siguiente procedimiento:
1) Se ordenan las observaciones.
2) Se calcula g, tal que g es la parte entera de 0.2 por n.
3) Se eliminan los g valores superiores e inferiores.
4) Con las n - 2g puntuaciones restantes se calculan las medias recortadas y medias winsorizadas, de tal forma que las medias recortadas son las medias aritméticas de dichas puntuaciones y las winsorizadas se obtienen según:

5) Se calculan las sumas cuadráticas winsorizadas:

6) Se calcula el estadístico de contraste:

que se distribuye según t de Student con grados de libertad:

Resultados
Robustez
Los resultados muestran que el contraste t de Student con las medias recortadas no parece comportarse mejor que cuando se lleva a cabo con la media aritmética, ya que, al igual que en este caso, la robustez se ve afectada por la forma de las distribuciones y la desigualdad de las varianzas.
En condiciones de homocedasticidad y normalidad, el contraste se mantiene robusto, obviamente. Sin embargo, la presencia de diferencias marcadas en los tamaños de los grupos (por ejemplo un grupo de tamaño 5 y el otro de cualquiera de los tamaños estudiados) produce proporciones de rechazos de la hipótesis nula (τ) muy superiores al valor 0,05 esperado. Con respecto a este resultado, hay que tener en cuenta que, como hemos visto, el método de cálculo de las medias recortadas reduce el número de datos a analizar, por lo que no es conveniente utilizar muestras excesivamente pequeñas con este procedimiento.
Cuando las varianzas se mantienen iguales pero las distribuciones no son normales, el comportamiento del contraste es distinto si la violación del supuesto es por apuntamiento o a por asimetría. En el primer caso, con tamaños moderados o grandes (mayores de 10) no se producen problemas en ninguna de las formas estudiadas. Sin embargo, cuando uno de los grupos tiene tamaño 5, el contraste, por la razón que ya hemos comentado, no es robusto. En el caso de una de las distribuciones platicúrticas, pasa lo mismo cuando uno de los grupos tiene tamaño 10. Cuando las distribuciones no son simétricas pero ambas tienen la misma forma, el contraste se mantiene robusto salvo en tamaños grupales de 5. Si uno de los grupos es normal y el otro asimétricos y el grado de asimetría es moderado (1 ó -1), se muestra ligeramente liberal, salvo, igualmente, en los casos de tamaño 5. Con asimetrías muy marcadas (2 y -2), o con formas distintas, el contraste no es robusto.
Bajo heterocedasticidad, igual que ocurría en casos de homocedasticidad, el apuntamiento no parece ser un problema relevante cuando el tamaño de los grupos es igual o mayor a 15. No obstante, la asimetría sí parece ser un problema de mayor importancia. Incluso en el caso de tamaños iguales, el contraste se muestra excesivamente liberal, no pudiendo considerarse robusto en ninguna de las condiciones estudiadas.
Potencia
Con respecto a la potencia, comentaremos sólo los resultados relativos al tamaño de efecto grande (aún cuando tenemos resultados sobre los tamaños de efecto mediano y pequeño, aún no hemos podido analizarlos), y únicamente para aquellas condiciones que se muestran robustas.
En condiciones de homocedasticidad, la mayor potencia se presenta en el caso de que las dos distribuciones sean leptocúrticas, mientras que los valores más bajos se producen en distribuciones platicúrticas.
En cuanto a la asimetría, y todavía en condiciones de homocedasticidad, comparando los resultados obtenidos con los de ambas distribuciones normales, las potencias obtenidas son menores en las condiciones normal- asimetría 2 y asimetrías negativas (de valores -1 y -2), iguales en la condición normal - asimetría 1 y superiores en todas las demás. Este resultado es congruente con el obtenido por Wilcox (1994), quien comprobó que en distribuciones no normales el contraste de medias recortadas resultaba superior a la solución de Welch.
En condiciones de heterocedasticidad, los resultados que hemos obtenido son curiosos: si la varianza mayor coincide con el grupo de mayor tamaño, la potencia de la prueba es mayor que en condiciones de homocedasticidad. En cambio, cuando la varianza mayor coincide con el tamaño grupal menor, las pérdidas en potencia son espectaculares. Como ejemplo, en el caso anterior y con dos distribuciones leptocúrticas, se obtiene un valor de 0,996 para tamaños de 25 y 30, mientras que en la condición cruzada, el valor obtenido es de 0,330.
Conclusiones
Como hemos podido observar, el contraste de medidas recortadas, mediante la + de Student tradicional, no es inmune a la violación de los supuestos de normalidad y homocedasticidad tomados conjuntamente. A la vista de nuestros resultados, y comparando con los que se obtienen con el contraste t de Student, sólo cabría recomendar el uso de medias recortadas cuando las distribuciones son asimétricas, pero se asegura el supuesto de homocedasticidad. |