Psicothema

Psicothema, 2000. Vol. Vol. 12 (nº 4). 695-700

COMPORTAMIENTO MUESTRAL DE LOS COEFICIENTES DEL ANÁLISIS DISCRIMINANTE

Gustavo M. Ramírez Santana, Juan A. Hernández Cabrera y Stephany Hess Medler

Universidad de La Laguna

En la investigación aplicada, la relevancia de las variables introducidas en un Análisis Discriminante, se asigna a través de una evaluación heurística de los coeficientes típicos y de estructura de las funciones discriminantes. En este contexto, es una cuestión fundamental conocer cuál de los dos coeficientes presenta una mejor eficiencia relativa y, en consecuencia, cuál es más seguro a la hora de tomar decisiones sobre la contribución de las variables empíricas. En el presente trabajo se analiza el sesgo y la estabilidad de los coeficientes típicos y de estructura, asociados a las funciones discriminantes. De la combinación de estos dos índices resulta la eficiencia relativa de los coeficientes, demostrándose que los coeficientes de estructura presentan un mejor comportamiento muestral que los típicos, siendo, por lo tanto los primeros los que deben ser utilizados a la hora de interpretar el espacio discriminante.

Sample behavior of the discriminant analysis coeficients. In applied research, the relevance of the variables introduced in a Discriminant Analysis is assigned through a heuristic evaluation based on the standardized coefficients and structure coefficients of the discriminant functions. In this context, it is a basic matter knowing which of both coefficients presents a better relative efficiency and, consequently, which one is safer when making decisions about the contribution of the empirical variables. We analyzed the bias and the stability of those coefficients. The relative efficiency of the coefficients results from joining these two indexes, demonstrating that the structure coefficients show a better sampling behavior than the standardized ones.

En la investigación aplicada, la relevancia de las variables introducidas en un Análisis Discriminante, se asigna a través de una evaluación heurística basada en la importancia, en términos de su valor numérico, de los coeficientes típicos y de estructura de las funciones discriminantes, tanto si el objetivo corresponde al estudio de las diferencias en la discriminación entre grupos, como si se refiere a la clasificación exhaustiva de sujetos. Una primera cuestión importante para el investigador aplicado cuando trabaja con este análisis, es conocer cuál de los dos coeficientes, típico o de estructura, es más eficiente y, en consecuencia, más seguro a la hora de tomar decisiones sobre la contribución de las variables empíricas, teniendo presente que en muchas ocasiones el investigador es consciente de que no todos los supuestos matemáticos subyacentes a la técnica se cumplen en la situación real.

Existen dos posibles formas de obtener ambos coeficientes, dependiendo de la matriz de covarianzas de la que surgen (vg.: Klecka, 1980; Tatsuoka, 1988; McLachland, 1992 o Huberty, 1994). En este sentido, el debate suscitado sobre la conveniencia de una u otra matriz se decanta por la matriz de covarianzas intra-grupos (Mueller & Cozard, 1988, 1994; Nordlund y Nagel, 1991).

Los coeficientes típicos se definen como C = D^1/2 _d .V, siendo D^1/2_d una matriz en la que los elementos de la diagonal son las raíces cuadradas de la diagonal principal de la matriz W, definida como W= (X - )’(X - ) . V representa una matriz (pxs) compuesta por todos los autovectores, siendo p el número de variables y s el número de funciones discriminantes.

Los coeficientes de estructura se definen como Z= R_w . C, siendo R_w la matriz de correlaciones de las variables discriminantes, definida como R_w= D^-1/2_d .W . D^-1/2_d y C representa la matriz de coeficientes típicos.

La finalidad del presente trabajo es analizar cuál de estos dos coeficientes, típicos y de estructura, asociados a las funciones discriminantes, presenta un mejor comportamiento, en base al estudio de su estabilidad y sesgo. Para cumplimentar este objetivo desarrollamos un análisis comparativo del comportamiento de ambos, para determinar cuál de los dos presenta una mejor eficiencia relativa y, por consiguiente, cuál debe ser utilizado en la interpretación, aun cuando se viola alguno de los supuestos matemáticos que se exigen a esta técnica (normalidad en la distribución de las variables, homogeneidad de varianzas, etc.). Para ello se realizó un barrido completo, mediante procedimientos de simulación de Montecarlo, de todas las características más relevantes del Análisis Discriminante.

Las investigaciones, en este contexto, se han centrado en el estudio de las características muestrales de los coeficientes típicos y de estructura. En este sentido, cabe señalar los trabajos que comparan estos coeficientes en el Análisis Multivariado de la Varianza y el Análisis Discriminante (Wilkinson, 1975; Spector, 1977; Borgen y Seling, 1978 y Camacho, 1990a). Sin embargo, a la vista de los resultados obtenidos, resulta deseable ahondar en el estudio de la distribución muestral de los coeficientes típicos y de estructura, a fin de determinar su eficiencia, ya que en general estos trabajos se limitan a unas pocas replicaciones Monte Carlo, sin llegar a realizar un examen exhaustivo de los supuestos básicos del análisis, cuestión que puede ser decisiva para determinar qué coeficiente es el más idóneo desde el punto de vista estadístico.

A los efectos del presente estudio y siguiendo a Camacho (1990b) definimos el sesgo como la diferencia en valor absoluto entre el parámetro correspondiente y la media de las estimaciones y la estabilidad como la desviación típica de las estimaciones, entendiendo, en consonancia, por eficiencia relativa el error cuadrático medio cometido por cada coeficiente en cada una de las condiciones, es decir, la suma de cuadrados de la estabilidad y los del sesgo de cada coeficiente.

Método

Se trabajó con un diseño factorial 4x2x3x2x3; es decir, 144 condiciones experimentales. Las cinco variables experimentales eran: Normalidad de las variables, (Normalidad, Asimetría extrema, Apuntamiento extremo y Ambos extremos), Varianza de los grupos (igual o diferente), Número de variables predictoras, (3, 6 ó 9), Número de grupos (3 ó 6) y Número de sujetos en cada grupo, (diferente número de sujetos, 25 sujetos por grupo y 100 sujetos por grupo).

En cuanto al factor Normalidad de las variables, se definió asimetría nula (0), asimetría extrema (2), apuntamiento nulo (0) y apuntamiento extremo (8): la combinación de estos dos niveles por índice, asimetría y apuntamiento, dio lugar a los cuatro niveles estudiados¹ . Para obtener las diferentes distribuciones de las muestras explicitadas en las condiciones experimentales, se utilizó la adaptación de Vale y Maurelli (1983) para el caso Multivariado del algoritmo de generación de distribuciones no normales de Fleishman (1978), elaborado por Hernández Cabrera, Sánchez Bruno y San Luis (1995). Se tomó como variable dependiente el sesgo y la estabilidad tal como han sido definidos antes.

Los procedimientos necesarios para la investigación fueron realizados en el lenguaje de programación GAUSS 386i, versión 3.1 (Aptech Systems, 1994). Se realizan 200 replicaciones Monte Carlo de cada condición experimental. Se otorgó el perfil de diferencias grupales siguiente para las condiciones con tres grupos:

_1i= 0 ; _2i= 3; _3i= 6, y para las condiciones con seis grupos: _1i = 0 ; _2i = 3 ; _3i = 6 ; _4i= 9 ; _5i= 12 ; _6i= 15, manteniéndose constantes las correlaciones entre las variables, 0,70. Se obtuvieron los coeficientes típicos y de estructura en cada replicación. El valor de los parámetros fue obtenido mediante el programa DSCRIMINANT del SPSS/PC+ v2.0

Resultados

Estudio del sesgo

Las tablas 1, 2 y 3 recogen los promedios del sesgo de los coeficientes de estructura y típicos para los tres niveles estudiados relativas al número de variables: 3, 6 y 9, respectivamente.

En términos generales, se puede observar que los coeficientes de estructura presentan un sesgo menor que el obtenido por los coeficientes típicos, oscilando los valores para el primero entre 0,0056 (tabla 3, condición de 9 variables predictoras, 6 grupos de 100 sujetos, homogeneidad y normalidad) y 0,1400 (tabla 1, condición de 3 variables predictoras, 3 grupos de distinto número de sujetos, heterogeneidad y normalidad). Para los típicos los valores oscilan entre 0,0136 (tabla 3, condición de 9 variables predictoras, 6 grupos de 100 sujetos, homogeneidad y asimetría) y 0,3286 (tabla 1, condición de 3 variables predictoras, 3 grupos de 25 sujetos, homogeneidad y asimetría).

Si estudiamos los resultados en virtud de los factores manipulados, hay que destacar que respecto al factor número de sujetos se comprueba que cuando se introducen 100 sujetos por grupo ambos coeficientes presentan el mejor comportamiento en todas las condiciones experimentales, independientemente de los niveles de los otros factores. En los otros dos niveles de este factor (25 sujetos en cada grupo y diferente número de sujetos dentro de cada grupo), los coeficientes típicos muestran un comportamiento inadecuado, mientras que los coeficientes de estructura presentan un sesgo moderado ante estos dos niveles. Este comportamiento inadecuado del coeficiente típico empeora en las condiciones de heterogeneidad, apreciándose sólo una mínima tendencia al aumento del sesgo del coeficiente estructura.

En relación al factor normalidad, podemos observar que los coeficientes típicos se ven más afectados que los de estructura por la presencia de asimetría extrema, ya sea sola o conjunta con valores altos de apuntamiento.

El factor número de variables, para los niveles aquí empleados, no afecta al sesgo, en la medida que los coeficientes no presentan un patrón de comportamiento definido a medida que se introducen variables en el análisis.

El factor número de grupos presenta un comportamiento que merece ser descrito con más detalle. En primer lugar, los coeficientes típicos muestran una tendencia clara a disminuir su sesgo a medida que se incrementa el número de grupos, mientras que los coeficientes de estructura presentan el efecto contrario, aunque menos acusado. En segundo lugar, cabe destacar que en las condiciones con seis grupos, independientemente de los niveles de las otras variables, el sesgo de los coeficientes de estructura es aproximadamente la mitad que el de los típicos, mientras que con tres grupos, esta diferencia se incrementa, siendo el sesgo de los de estructura cuatro veces menor que el de los típicos.

Por último, considerando el factor varianza de los grupos, en todas las condiciones de heterogeneidad existe una tendencia al aumento del sesgo en ambos coeficientes, siendo ésta más acusada en el caso de los coeficientes típicos.

Estudio de la Estabilidad

En cuanto a la estabilidad, se presentan en la tabla 4 los promedios para cada coeficiente. Se puede observar que los coeficientes de estructura vuelven a mostrar un mejor comportamiento que los coeficientes típicos en todas las condiciones.

Los coeficientes de estructura oscilan entre un índice de estabilidad de 0,0010 (tabla 4, condición de 3 variables, 6 grupos con diferente número de sujetos, homogeneidad y normalidad) y 0,0700 en el peor de los comportamientos (tabla 5, condición de 3 variables, 3 grupos con 25 sujetos, heterogeneidad y asimetría). Por su parte, los coeficientes típicos oscilan entre 0,0116 (tabla 4, condición de 3 variables, 6 grupos con 100 sujetos, homogeneidad y asimetría) y 0,3980 (tabla 4, condición de 3 variables, 3 grupos con 25 sujetos, heterogeneidad y asimetría).

Ambos coeficientes siguen un comportamiento paralelo, salvando las distancias entre ellos: el de estructura llega a tener un índice de estabilidad ochenta veces menor que el del coeficiente típico, siendo incluso seis veces menor en las situaciones experimentales donde se minimizan las distancias entre ambos.

El factor número de sujetos dentro de cada grupo (veinticinco sujetos en cada uno o diferente número de sujetos en cada grupo) no parece estar influyendo en la estabilidad de los coeficientes, en la medida que los dos presentan un patrón de comportamiento similar ante estos dos niveles del factor en todas las condiciones experimentales. El coeficiente típico presenta una mínima pérdida de estabilidad con 25 sujetos con respecto a un número diferente de sujetos, mientras que cuando se realiza el análisis con 100 sujetos por grupo, se alcanza una alta estabilidad, coincidiendo con los resultados obtenidos en relación al sesgo.

El factor de normalidad da el mejor comportamiento para los dos coeficientes en las condiciones de normalidad, mostrándose más sensibles a la presencia de asimetría extrema y de asimetría conjunta con apuntamiento, que ante la presencia de apuntamiento extremo (tanto cuando se introduce 25 sujetos por grupo, como cuando se realiza el análisis con diferentes tamaño grupales). En las condiciones de heterogeneidad se mantiene este patrón, aunque con una sensible pérdida de estabilidad. Por su parte, en el coeficiente de estructura estas diferencias se minimizan, debido a la alta estabilidad del coeficiente, aún ante la presencia de heterogeneidad (donde la pérdida de estabilidad es mínima) para todas las condiciones de tamaños grupales. El coeficiente típico sólo consigue una estabilidad comparable en las condiciones con 100 sujetos.

El número de variables incluidas en el análisis no parece estar influyendo en la estabilidad de los coeficientes, en la medida en que ninguno de los dos presenta un patrón de comportamiento diferenciado ante los niveles de este factor.

El factor número de grupos aumenta la estabilidad de los dos coeficientes a medida que se introducen más grupos en el análisis. Sin embargo, este aumento sólo se muestra relevante cuando se trabaja con los niveles 25 sujetos y diferente número de sujetos, puesto que, como ya se ha podido ver en los párrafos anteriores, el coeficiente típico es estable cuando los grupos tienen 100 sujetos y el coeficiente de estructura muestra una alta estabilidad en todas las condiciones experimentales.

Por último, y analizando el efecto del factor varianza de los grupos, en todas las condiciones de homogeneidad, independientemente del número de variables y de grupos, del número de sujetos dentro de cada uno de ellos y de las alteraciones de la normalidad, ambos coeficientes presentan una variación menor frente a las de heterogeneidad.

Estudio de la Eficiencia Relativa

Por último, con el objeto de comprobar globalmente el comportamiento de ambos coeficientes, se tomó como índice de la eficiencia relativa de los coeficientes, el error cuadrático medio cometido por cada coeficiente en cada una de las condiciones, es decir, la suma de los cuadrados de la estabilidad y los del sesgo de cada coeficiente (Camacho 1990b). Por lo tanto, un coeficiente será más eficiente cuanto más se aproxime su índice a cero, puesto que implicará un sesgo pequeño y una alta estabilidad.

Como es obvio, al ser una combinación de los dos índices anteriores, y dado que ya se comprobó un mejor comportamiento en cada uno de esos índices por separado en todas las situaciones experimentales, el coeficiente de estructura se muestra más eficiente que el típico en todas las situaciones, siendo su índice de eficiencia relativa hasta veinticinco veces menor que el del típico. Así, mientras que el índice del coeficiente de estructura oscila entre 0,0042 y 0,0196, el del coeficiente típico lo hace entre 0,0205 y 0,2338.

Cuando realizamos un estudio pormenorizado de ambos coeficientes por separado, se observa cómo se incrementa la eficiencia relativa de los coeficientes de estructura cuando añadimos variables al análisis, mientras que no se aprecian diferencias en el comportamiento de los coeficientes típicos ante este factor. Sin embargo, en las condiciones con seis grupos se produce una mínima pérdida de la eficiencia en los coeficientes de estructura, mientras que en los típicos aparece el patrón contrario, sin que esto altere la distancia entre la eficiencia relativa de los dos coeficientes.

En cuanto a la varianza de los grupos y al factor normalidad, los dos coeficientes siguen el mismo comportamiento que en el sesgo y la estabilidad, es decir, se produce una pérdida de eficiencia relativa ante la presencia de heterogeneidad y/o de asimetría extrema, en todas las condiciones.

Conclusiones

Para concluir con el estudio de las características muestrales de los coeficientes, la heterogeneidad afecta a los dos coeficientes del Análisis. Además, ambos se muestran más sensibles a la presencia de Asimetría que a la presencia de Apuntamiento. Sin embargo, los coeficientes de estructura mostraron un mejor comportamiento en todas las condiciones, menor sesgo y mayor estabilidad, siendo considerablemente más eficientes que los típicos. El estudio del sesgo y la estabilidad de los coeficientes típicos y de estructura de las funciones discriminantes del Análisis Discriminante, utilizados habitualmente para el estudio de la importancia e interpretación de las variables implicadas en el análisis, demuestra que los coeficientes de estructura presentan un mejor comportamiento, en términos de eficiencia relativa (menor sesgo y mayor estabilidad) en todas las situaciones que tienen potencial relevancia en el análisis (violación del supuesto de normalidad y/o homocedasticidad, número de grupos, número de sujetos por grupo y número de variables predictoras).

A la vista de estos resultados, recomendamos que los coeficientes de estructura sean los utilizados en la interpretación del espacio discriminante.

Nota

¹ Tanto la asimetría como el apuntamiento han sido normalizados, tomando los dos índices un valor de 0 en el caso de ausencia de asimetría y de apuntamiento mesocúrtico.

Borgen, F.H., & Seling, M.J. (1978). Uses of Discriminant Analysis Following MANOVA: Multivariate Statistics for Multivariate Purposes. Journal of Applied Psychology, 63, 689-697.

Camacho, J. (1990a). Interpretación del MANOVA: Análisis de la importancia de las Variables Dependientes. Qurrículum, 1, 107-120.

Camacho, J. (1990b). Un estudio de Monte Carlo sobre la estabilidad y el sesgo de los coeficientes en el análisis discriminante. Qurrículum, 2, 83-90.

Fleishman, A.I. (1978). A method for simulating non-normal distributions. Psychometrika, 43, 521-529.

GAUSS System version 3.0. (1992). Washington: Aptech Systems, Inc.

Hernández Cabrera, J.A., San Luis, C., & Sánchez Bruno, J.A. (1995). Un programa GAUSS para simular distribuciones no normales multivariadas. Psicothema, 7, 427-434.

Huberty, C.J. (1994). Applied Discriminant Analysis. New York: Wiley.

Klecka, W.R. (1980). Discriminant Analysis. Beverly Hills: Sage.

McLachland, G.J. (1992). Discriminant Analysis and Statistical Pattern Recognition. New Yor: Wiley.

Mueller, R.O. & Cozard, J.B. (1988). Standardized Discriminant Coefficients: Wich Variance Estimate is Appropiate? Journal of Educational Statistics, 13, 313-318

Mueller, R.O. & Cozard, J.B. (1994). Standarized Discriminant Coefficients: A rejoinder. Journal of Educational Statistics, 18, 108-114.

Nordlund, D.J. & Nagel, R. (1981). Standarized Discriminant Coefficients revised. Journal of Educational Statistics, 16, 101-108.

Spector, P.E. (1977). What to Do with Significant Multivariate Effects in MANOVA. Journal of Applied Psychology, 62, 158-163.

Vale, C.D., & Maurelli, V.A. (1983). Simulating multivariate nonnormal distributions. Psychometrika, 48, 465-471.

Wilkinson, L. (1975). Response Variable Hypothesis in the Multivariate Analysis of Variance. Psychological Bulletin, 82, 408-412.

Aceptado el 17 de mayo de 2000

INFORMACIÓN

PSICOTHEMA

CONTACTO

COMPORTAMIENTO MUESTRAL DE LOS COEFICIENTES DEL ANÁLISIS DISCRIMINANTE