Psicothema

Psicothema, 1991. Vol. Vol. 3 (nº 2). 499-502

COMPUTERIZED ADAPTING TESTING: A PRIMER. HOWARD WAINER

Howard WAINER

Hillsdale, New Jersey: LEA, 1990. 300 pp. + xvi. 45 dólares USA.

Este libro coordinado por Wainer y al que contribuyen Beil J. Dorans, Ronald Flaugher, Bert F. Green, Robert J. Mislevy, Lynne Steinberg y David Thissen, viene a cerrar una década de excelentes textos sobre evaluación psicológica, década que fuera abierta precisamente por Lord (Lord, 1980) con un hito bibliográfico en el área.

La razón fundamental de este florecimiento en los 80 hay que buscarla fundamentalmente en el impulso generado por los modelos de Teoría de Respuesta a los Items (TRI), que cambiarán por completo la tecnología psicométrica clásica. Este marco general proporcionado por la TRI (Andrich, 1988; Hambleton y Swaminathan, 1985; Hulin, Drasgow y Parsons, 1983; Weiss, 1983; Wright y Masters, 1982) va a permitir a las distintas subáreas un desarrollo propio sin precedentes, que tras varios años de investigaciones harán posible recoger los frutos en textos comprensivos. Así Holland y Rubin (1982) editan una monografía sobre Equiparación (Equating), Reynolls y Brown (1984) sobre Sesgo, Berk (1984) hace lo propio con los Test Referidos al criterio, Osterlind (1989) se ocupa de la Construcción de los items, Wainer y Braun (1988) sintetizan lo referente a la Validez, y Linn (1989) reune en la tercera edición del clásico "Educational Measurement" a una pléyade de primeras figuras que dan cuenta de los principales desarrollos en las distintas áreas: Fiabilidad, Validez, TRI, Sesgo, Equating, Test Computerizados, etc. Para lo 90 todo parece indicar que esta tendencia va a continuar, incluso acentuarse, y, por ejemplo, SAGE en una nueva serie sobre medición ya tiene contratados libros sobre TRI, Teoría de la Generabilidad y Sesgo; la organización internacional "Internacional Testing Comission" editará a Kluwer un extenso manual recogiendo los últimos avances en las distintas áreas, y LEA ya anuncia un monográfico sobre Sesgo, el tema de moda, últimamente rebautizado como Funcionamiento Diferencial de los Items (tal vez para cuando se publique esta revisión algunos de los textos citados ya estén en el mercado). Nótese que este desarrollo que ha ido convirtiendo los capítulos de antaño en monografías, no significa que la Teoría Clásica de los test haya desaparecido del panorama psicométrico actual ni mucho menos, prueba fehaciente de lo cual es la polémica reimpresión por LEA en 1987 del clásico por excelencia Gulliksen (1950), las nuevas ediciones de los incombustibles Anastasi (1988, 61 ed.) y Cronbach (1984, 0 ed.), o la nueva edición de los Standards for Educational and Psychological Testing (1985); además de la aparición de nuevos textos como el excelente de Crocker y Algina (1986), o Brennan (1983).

Faltaba sin duda un texto que reuniera lo fundamental de las investigaciones de más de una década sobre Test Computerizados a Medida (no confundir, por favor, con test aplicados por una omputadora), y ese será precisamente el objetivo del libro dirigido por Wainer.

Vaya por delante una nota frívola sobre el envoltorio, y es que da gusto ver y tocar el libro, una edición muy cuidada, que aunque habitual, no siempre ocurre con LEA; para mi gusto hubiese suprimido del título los dos puntos y lo que sigue, "A Primer", pues el libro no es tan elemental como para subrayarlo en el título, salvo que se tenga una sólida base de TRI, claro que en algunos lugares esto ya no se asume como parte de la cultura psicométrica; confieso además que nunca me gustaron los dos puntos en los títulos, pues para aclaraciones más vale pasar al interior.

El libro es sencillamente fundamental para todo aquel profesional cuya labor toque de algún modo la evaluación de variables psicológicas o educativas. En psicometría la época del mismo instrumento para todos los sujetos sencillamente ha terminado, las nuevas tecnologías derivadas de la TRI permiten la administración del test más apropiado para cada sujeto, minimizando así el error de medida, y expresando no obstante los resultados en la misma escala. En el texto de Wainer se expone con claridad y a un nivel asequible el cómo hacerlo, los problemas implicados y las perspectivas de futuro, todo ello en nueve capítulos sin desperdicio. En el primer capítulo, escrito por el propio Wainer, se traza una breve pero interesante historia de la medición psicológica, tomada básicamente para los primeros años de DuBois (1970), libro, por cierto, fundamental y que lleva años agotados. Wainer ofrece una visión panorámica de los principales aspectos implicados en los Test

Computerizados a Medida (TCM), a los que luego se dedicarán los capítulos correspondientes. Green se ocupa de todo lo relativo al equipo informático implicado, hardware y software (capítulo 2), Flaugher hace lo propio con los Bancos de Items, fundamentales para la implementación de los TCM (capítulo 3), Wainer y Mislevy condensan en el capítulo 4 de las nociones de TRI que consideran necesarias para la comprensión y uso de los TCM. Los algoritmos necesarios para la implementación efectiva de los TCM son descritos por Thissen y Mislevy (capítulo 5), Dorans se ocupa del Escalamiento y Equating (capítulo 6), Thissen de la fiabilidad (capítulo 7), Steinberg, Thissen y Wainer de la validez (capítulo 8), y los autores terminan mancomunándose con un capítulo acerca del futuro. Este último resulta uno de los capítulos más interesantes del libro, apuntando los autores posibles soluciones para problemas aún planteados, así como las implicaciones de los TCM para la evaluación en áreas como Personalidad o Actitudes, con un gran potencial para aprovecharse de esta nueva tecnología. Todas las ejemplificaciones a lo largo del libro se hacen con una batería hipotética generada a tal efecto (GCAT), lo que ayuda al lector y da unidad a los diferentes capítulos.

Como no puede ser de otra manera unos capítulos son mejores que otros, y los especialistas en cada uno de ellos echarán de menos matizaciones varias, pero en general el libro ubica al lector en una buena plataforma de observación para entender lo que está pasando en los TCM, y por donde se prevee que pasarán las líneas calientes de investigación futura. Nuestro consejo al lector es que para una comprensión cabal del libro resulta imprescindible que antes de atacarlo se asegure de que sus conocimientos de TRI son apropiados, como mínimo a nivel de Berk (1985) o Muñiz (1990). Tal vez sorprenda a algunos lectores que autores tan clásicos en el área de los TCM como Mark D., Reckase o David J. Weis no colaboren en el libro, y aparezcan menos citados de lo habitual, pero ya se sabe, todos los colegios invisibles saltan a la vista, de ahí su nombre, y el libro se ha nucleado en torno a investigadores en la nómina de Educational Testing Service, lo que puede echar una mano a Freud para explicar, por ejemplo, el olvidarse de citar el MicroCAT (Assessment Systems Corporation, 1984), único software comercializado en la actualidad para la implementación de TCM, y que más que acto fallido nos parece un fallo injustificado.

En resumen, todo lo dicho se puede sintetizar en las cinco amigables palabras: yo que tú lo leería.

REFERENCIAS

Anastasi, A. (1988). Psychological testing. New York: Macmillan. (6ª ed.).

Andrich, D. (1988). Rasch models for measurement. Berverly Hills, California: SAGE.

Assessment Systems Corporation (1984). User's manual for the MicroCAT testing system. St. Paul, MN: Author.

Baker, F. B. (1985). The basis of Item Response Theory. Pottsmouth, NB: Heineman.

Berk, R. A. (Ed.) (1984). A guide to criterion-referenced test construction (2ª Ed.) Baltimore, MD: The John Hopkins University Press.

Brennan, R. L. (1983). Elements of generalizability theory. Iowa city, IA: American College Testing Program.

Crocker, L. y Algina, J. (1986). Introduction to classical and modern test theory. New York: Holt, Rinehart and Winston.

Cronbach, L. J. (1984). Essentials of psychological testing. New York: Harper and Row. (4ª ed.). DuBois, P. H. (1970). A history for psychological testing. Boston: Allyn and Bacon.

Gulliksen, H. (1950). Theory of mental test. N. York: Wiley (reimpreso en 1987).

Hambleton, R. K. (1983). (Ed.). Applications of item response theory. Vancouver: Educational Research Institute of British Columbia.

Hambleton, R. K. y Swaminathan, H (1985). ltem Response Theory. Boston: Kluwer Academic Publishers.

Holland, D. W. y Rubin, D. R. (1982). Test equating. N. York: Academic Press.

Hulin, C. L., Drasgow, F. y Parsons, C. K. (1983). Item response theory. Application to psychological measurement. Homewood, IL: Dow JonesIrwin.

Linn, R. L. (Ed.) (1983). Educational Measurement. New York: MacMillan.

Muñiz, J. (1990). Teoría de respuesta a los ítems. Madrid: Pirámide.

Osterlind, S. J. (1989). Constructing tests ítems. Boston: Kluwer Academic Publishers.

Reynolds, C. R. y Brown, R. T. (Eds.) (1984). Perspectives on bias in mental testing. N. York: Plenum Press.

Standards for educational and psychological testing (1985). Washington, DC: American Psychological Association.

Wainer, H. y Braun, H. I. (Eds). (1988). Test validity.. Hillsdale, N. J.: LEA.

Weiss, D. J. (ed.) (1983). New horizons in testing. N. York: Academic Press.

Wright, B. D. y Masters, G. N. (1982). Rating scale analysis: Rasch measurement. Chicago: MESA Press.

English

INFORMACIÓN

PSICOTHEMA

CONTACTO

COMPUTERIZED ADAPTING TESTING: A PRIMER. HOWARD WAINER