INFORMACIÓN

La revista Psicothema fue fundada en Asturias en 1989 y está editada conjuntamente por la Facultad y el Departamento de Psicología de la Universidad de Oviedo y el Colegio Oficial de Psicología del Principado de Asturias. Publica cuatro números al año.
Se admiten trabajos tanto de investigación básica como aplicada, pertenecientes a cualquier ámbito de la Psicología, que previamente a su publicación son evaluados anónimamente por revisores externos.

PSICOTHEMA
  • Director: Laura E. Gómez Sánchez
  • Periodicidad:
         Febrero | Mayo | Agosto | Noviembre
  • ISSN: 0214-9915
  • ISSN Electrónico: 1886-144X
CONTACTO
  • Dirección: Ildelfonso Sánchez del Río, 4, 1º B
    33001 Oviedo (España)
  • Teléfono: 985 285 778
  • Fax:985 281 374
  • Email: psicothema@cop.es

Psicothema, 2003. Vol. Vol. 15 (nº 1). 127-135




VEREDICTOS Y ANÁLISIS DEL CONTENIDO DE LAS DELIBERACIONES DE LOS TRIBUNALES DE JUECES Y JURADOS EN EL CONTEXTO JURÍDICO ESPAÑOL

Ramón Arce, Francisco Tortosa* y Elisa Alfaro**

Universidad de Santiago de Compostela, * Universidad de Valencia y ** Universidad Jaime I de Castellón

Sobre la base de que son numerosas y consistentes inter-contextos jurídicos las críticas a la eficacia de los Tribunales de Jurados, nos hemos planteado un estudio comparativo de la ejecución de Tribunales de Jueces y Jurados en el ordenamiento jurídico español (L.O. 5/1995). Tomando como material estimular tres casos reales, formamos 15 Tribunales de Jurados y 15 Tribunales de Jueces, que emitieron el objeto del veredicto tras la discusión grupal. Los resultados mostraron que tanto Jueces como Jurados no ejecutan de un modo normativo; que la ejecución de los Jurados es de peor calidad; que Jueces y Jurados ejecutan tareas distintas, más orientados a la defensa los Jurados y más a la acusación los Jueces; y que las deliberaciones de los Jurados no son más profundas para compensar su falta de conocimientos en la materia. Finalmente, discutimos las implicaciones para contrarrestar estos déficit en la actuación de Jueces y Jurados.

Verdict and deliberation content analysis of judges and juries in the Spanish legal context. A contrastive approach. Bearing in mind that jury performance has been subject to considerable criticism in various countries, the aim of the present paper is to contrast the judges’ and jury performance. A total of 15 nine-member juries and 15 three-member panels of judges deliberated and reached a verdict on real cases. The results of a contrastive analysis reveal a) neither judges nor juries perform in a normative way; b) juries perform worse than judges; c) judges and juries perform different tasks, driven to the defence by the juries and to the prosecution by the judges; and d) the juries’ deliberations are not more exhaustive than the judges’ as would be expected in order to compensate for their lack of legal knowledge and experience, and tend to be redundant in content. Finally, the practical implications are discussed as well mechanisms designed to mitigate the non-normative decision-making of judges and juries.

PDF

Se ha achacado en muchas ocasiones al Jurado incapacidad, ineptitud y falta de preparación para ejercer la función que le es encomendada como miembro del aparato judicial. Es decir, se le ha señalado como incompetente. Sin embargo, la investigación sistemática en esta dirección no parece llegar a las mismas conclusiones. En este sentido, Kalven y Zeisel (1966) clasificaron, en función de la opinión modal de Jueces, casos ya juzgados por Jurados como fáciles, difíciles y muy difíciles. Si el Jurado fuera incompetente, las divergencias en cuanto al veredicto entre Jueces y Jurados deberían darse en los casos difíciles y, sobre todo, en los muy difíciles. Los datos, por el contrario, señalan que las discrepancias se distribuyen por igual entre las tres condiciones. Por tanto, no se puede concluir que el Jurado no comprenda la evidencia presentada. En un intento posterior de repetir los trabajos de Kalven y Zeisel, Baldwin y McConville (1979) advirtieron que los Jueces, en algunas ocasiones, entendían que el Jurado había aplicado «lo justo» en vez de «lo legal». Estos resultados también fueron confirmados por Myers (1979) quien observó, tras estudiar 201 casos penales, que los Jurados raramente se apartaban de la ley y no lo hacían por incompetencia, sino para seguir sus percepciones de lo que era «justo y correcto». En una línea explicativa complementaria, MacCoun y Kerr (1988) demostraron que Jueces y Jurados difieren en la tendencia de los Jueces hacia la culpabilidad en casos de duda razonable, mientras que los Jurados lo hacen hacia la inocencia. Donde sí se han hallado algunos resultados que pudieran servir como validadores de esa acusación de incompetencia es en el tema de la comprensión de las instrucciones (Elwork, Sales y Alfini, 1977) y en casos civiles, especialmente en los complejos (p.e., Chin y Peterson, 1985).

Por su parte, en relación con las decisiones judiciales llevadas a cabo por Jueces, la literatura se ha centrado en el estudio de la disparidad (para una revisión exhaustiva véase Kapardis, 1997). Son muy numerosos los informes de investigación que ponen de manifiesto una gran disparidad en las decisiones judiciales tanto en la decisión de encarcelar (p.e., Partdridge y Eldridge, 1974; Diamond y Zeisel, 1975) como en la longitud de la pena (v.gr., Sutton, 1978). Los intentos de explicación de esa disparidad apuntan a la trascendencia tanto de variables legales como extralegales. Sobre la variables de orden legal y tras una revisión de 140 estudios, Kapardis (1985) encontró los siguientes factores legales como los de mayor relevancia en la explicación de la variabilidad de las sentencias: la recencia de la última condena; el historial delictivo; el tipo de acusación; la interacción pasada con el sistema de justicia; la recomendación de sentencia emitida por el funcionario supervisor de la libertad condicional; o la provocación por parte de la víctima del delito. Recientemente, uno de nosotros (Arce et al., 2001) ha encontrado que la estimación de la fiabilidad (p.e., credibilidad de los distintos testimonios) y validez (valor de cada prueba para la decisión) de cada ítem de evidencia, un factor de orden legal, explica la mayoría de la varianza de la disparidad. Entre las numerosas variables extralegales estudiadas por su influencia sobre el corpus de la sentencia, destaca por su relevancia y consistencia el papel desempeñado por el propio agente decisor y, en relación con éste, la orientación penal de carácter rehabilitativo o utilitario que da lugar a decisiones dispares (v.gr., Sobral y Prieto, 1994). Finalmente, una última línea de trabajo de orden extralegal, llevada a cabo desde España, ha puesto de manifiesto a través del estudio de sentencias de archivo que éstas están, en buena medida, determinadas por el uso de heurísticos, esto es, en la comisión de sesgos sistemáticos de juicio (Garrido y Herrero, 1995; Arce et al., 1996; Fariña, Novo y Arce, 2002).

En resumen, la literatura científica ha dado muestras suficientes de que las decisiones legales están sujetas a sesgos y, por extensión, a la comisión de errores, encaminándose a la búsqueda de soluciones a estos desajustes (v.gr., Heuer y Penrod, 1994). No obstante, la gran mayoría de estos resultados no son extrapolables al ordenamiento jurídico español. En relación con la actuación del Jurado, éste se rige por la Ley Orgánica 5/1995 del Tribunal de Jurado que prevé la actuación en el marco penal limitada a ciertos delitos y entendiendo sobre el objeto del veredicto. El objeto del veredicto va más allá de la estimación de inocencia o culpabilidad, respondiendo a un cuestionario elaborado por el magistrado ponente con las alegaciones de las partes. Asimismo, se diferencia en la composición y regla resolutoria que lo define: 9 miembros que deciden por mayoría cualificada sobre cada ítem de evidencia. Esta fenomenología del Jurado presenta unas implicaciones que lo diferencian en las decisiones alcanzadas de otras modalidades (Fariña, Arce y Vila, 1999).

En este contexto, nos planteamos llevar a cabo un estudio experimental de alta fidelidad en el que se comparara la ejecución de Tribunales de Jueces y Jurados al amparo de la legislación española. El objetivo central era contrastar los contenidos de las discusiones grupales y de las decisiones alcanzadas, eje central de la toma de decisiones que generalmente es obviado en la investigación científica.

Método

Sujetos

La muestra la compusieron dos grupos bien diferenciados. Por una parte, los jurados, en un total de 135. Todos ellos superaban la mayoría de edad, se encontraban en pleno ejercicio de sus derechos civiles y políticos, en posesión del título de graduado escolar, y no estaban afectados de discapacidad física o psíquica, requisitos necesarios para ejercer su función como Jurado. La edad media era de 25.53 (Sx= 7.73) y con un rango que abarcaba desde los 18 a los 50 años. Por géneros y tomando en consideración las respuestas voluntarias de los sujetos, el 18.6% eran varones en tanto el restante 81.4% eran mujeres. En relación con el estado civil, el 87.3% de las respuestas informaban que eran solteros en tanto el 16.3% decían ser casados. Otra parte de la muestra eran jueces y magistrados con más de un año de actuación como tales (los datos sociodemográficos de esta parte de la muestra no se proporcionan, a petición de los mismos, ya que podrían identificarlos).

Procedimiento

A los jurados se les instruyó previamente en lo qué es un Tribunal de Jurado y cuál era la tarea a desarrollar. A continuación se les presentaba, tanto a jueces como a jurados, la grabación en vídeo de uno de los casos reales descritos en el apartado de material. En concreto, se constituyeron 15 Tribunales de Jurados, de nueve miembros cada uno, y 15 Tribunales de Jueces, de 3 miembros cada uno. La secuencia de la tarea consistió en 4 pasos tras la constitución de los Tribunales:

a) Los jurados y jueces cumplimentaron individualmente una serie de datos sociodemográficos (p.e., nombre, edad, género, estado civil, nivel de estudios, lugar de residencia). La muestra de jueces solicitó expresamente que no se incluyeran estos datos a fin de no poder ser identificados.

b) Veían la grabación en vídeo de un caso real (véase en el apartado de material).

c) A continuación pasaban a deliberar. En las deliberaciones, que fueron grabadas en vídeo, no se estableció un límite de tiempo y se regían por la regla de decisión española indicándoseles que trataran de llegar a un veredicto unánime en el caso de los Tribunales de Jurados. A los Tribunales de Jueces no fue preciso instruirlos por sus conocimientos ni nombrar cargos porque actuaban realmente como tales.

d) Por último, se recogía el veredicto grupal (objeto del veredicto) tal y como había sido definido en el caso original.

Material

Tanto a los jurados como a los jueces, constituidos en tribunal, se les presentaron uno de tres casos judiciales reales grabados en vídeo, cuyo resumen de calificaciones, se expone a continuación.

En el Caso I, acusación contra J.M.A. (ver nota al pie)1. la calificación de la Fiscalía fue, «…el acusado J.M.A. mayor de edad y afectado por un trastorno paranoide, que deteriora las bases psicobiológicas de su imputabilidad, el día D sobre las H horas cuando su vecina E.L.C. salía de su domicilio, con la intención de coger el vehículo de su propiedad, de manera sorpresiva, portando una barra de hierro de 64 cm de longitud y 12 mm de diámetro, con ánimo de matar, la acometió por la espalda, golpeándola en la cabeza. Como consecuencia, la Sra. E.L.C. cayó al suelo, donde siguió golpeándola en cabeza y cuerpo, no llegando a obtener su propósito por la intervención de otro vecino. La Sra. E.L.C. resultó con traumatismo cráneo-encefálico con herida inciso contusa de 15 cm en cuero cabelludo y contusiones varias, estando impedida para sus ocupaciones durante 22 días. Por ello, la fiscalía califica los hechos como constitutivos de un delito de asesinato en grado de frustración. Concurre en el acusado la eximente incompleta de enajenación mental. Procede imponer al acusado la pena de 10 años de Prisión Mayor y accesorias».

De acuerdo con la Acusación Particular, los hechos son constitutivos de un delito de asesinato frustrado. Concurre la atenuante de enajenación mental. Procede imponer la pena de doce años de Prisión Mayor y accesorias más responsabilidad civil.

Por su parte, la Defensa «… en disconformidad con la correlativa del Ministerio Fiscal y con los hechos que plasma la Acusación, toda vez que se olvida citar el estado de excitación y continua agresión a que fue sometido mi defendido por la persona agredida; conocedora del estado mental desequilibrado en que se encuentra desde hace años; y sin que con ello se pretenda justificar el resto de los hechos y la concreta agresión sufrida. En una persona con el estado mental distorsionado y con su voluntad totalmente quebrada no podemos delimitar su voluntad o no de causar un daño tan grave como el causado al no ser consciente de lo qué hacía. En consecuencia, calificamos los hechos como constitutivos de un delito de asesinato frustrado, concurriendo la circunstancia eximente de enajenación mental».

En el Caso II, acusación contra J.C.O., el Ministerio Fiscal calificó los hechos como, «… el acusado J.C.O. mayor de edad y con un trastorno paranoide, que atenúa notablemente sus facultades intelectivas y volitivas, el día D se dirigió a un campo propiedad de J.A.A. en busca de éste, guiado por el ánimo de darle muerte debido a unos enfrentamientos que éstos tenían por motivo de unos campos. El procesado persiguió a J.A.A. provisto de un hacha sin que pudiera llevar a cabo su propósito al intervenir E.V. Tres meses más tarde, el procesado, guiado por idéntico ánimo y portando un palo de madera en cuyo extremo había atado un hacha, se dirigió al mismo lugar persiguiendo nuevamente a J.A.A. al tiempo que le decía »te voy a matar«. No pudo conseguir su propósito gracias a la intervención de E.V., quien estaba en el lugar a petición de J.A.A. ante el temor que éste tenía de que pudiera el procesado atentar contra su vida. Dicha persona, a bordo de su vehículo, se puso a la altura de J.A.A., a fin de que éste pudiera escapar como así lo hicieron. Por todo ello, califico los hechos como constitutivos de dos delitos de homicidio en grado de tentativa. Concurre la eximente incompleta de enajenación mental. Procede imponer la pena de dos años de Prisión Menor por cada uno de los dos delitos».

Para la Acusación Particular, «….los hechos son constitutivos de dos delitos de homicidio en grado de tentativa. Concurre la eximente incompleta de enajenación mental. Procede imponer la pena de dos años de Prisión Menor por cada uno de los dos delitos».

Finalmente, la Defensa, «…en disconformidad con la correlativa del Ministerio Fiscal y de la Acusación por entender que de la narración que de los hechos se hace en los escritos de acusación no se ajustan la realidad de lo acontecido. Los hechos tal y como acontecieron no constituyen delito alguno o existe delito de amenazas. Concurre la eximente de enajenación mental o bien procede apreciar como muy cualificada la atenuante de enajenación mental».

En el Caso III, acusación contra F.M.C., el Ministerio Fiscal formuló la siguiente calificación de los hechos: «… el procesado F.M.C., mayor de edad, se hallaba junto a S.E.L en el interior de la vivienda que constituye la residencia habitual de ambos, como surgiese una conversación entre ambos que contrarió al procesado. Éste, de forma repentina e inesperada, tras extraer de su bolsillo una navaja de 9 cm de longitud y 2 cm de anchura, con intención de acabar con su vida, se abalanzó sobre aquél, asentándole sendas puñaladas en el hemitórax izquierdo y ocasionándole una herida de 2 cm de longitud a 9 cm hacia abajo y 1 cm. a la derecha de la areola izquierda mamaria; y otra de la misma longitud a 2 cm por debajo y 4 por la izquierda de la reseñada areola mamaria. Ésta última quedó comprendida dentro de la zona precordial, aunque sin llegar a interesar la víscera cardiaca, atravesando ambas la pared torácica y produciendo derrame pleural y pequeño neumotórax, sin que, ante lo inopinado del ataque, pudiese S.E.L. llevar a cabo maniobra alguna para repeler la agresión a que fue sometido. El procesado acto seguido abandonó dicho lugar al haberse aplacado su enojo. Por todo ello, califica los hechos como constitutivos de un delito de asesinato frustrado. Concurre la atenuante analógica de enajenación mental. Procede imponer al acusado la pena de dieciocho años de Prisión Mayor».

Para la Acusación Particular, «… el procesado F.M.C. encontrándose en su domicilio, que también lo es de S.E.L, tras mantener una conversación con éste que desató su ira, de manera sorpresiva sacó una navaja de su bolsillo y le asestó dos navajazos, provocándole las heridas que constan en autos. Así, los hechos son constitutivos de un delito de asesinato frustrado. Apreciamos la atenuante analógica de enajenación mental. Procede imponer al acusado la pena de dieciocho años de prisión mayor».

Para la Defensa, «… el procesado F.M.C., el cual padece trastornos psíquicos desde hace varios años, habiendo estado internado en centros psiquiátricos como el de B. El día D, a raíz de una fuerte discusión con su tío S.E.L., se enfureció tanto que se abalanzó sobre éste y le asestó dos puñaladas, produciéndole las lesiones que constan en autos. Ello sin intención alguna de acabar con su vida, siendo tan sólo fruto del arrebato que la discusión le produjo y debido a los trastornos psíquicos antes indicados. Por ende, calificamos los hechos constitutivos de un delito de lesiones. Concurre la circunstancia atenuante analógica de enajenación mental. Procede imponer la pena de un año y seis meses de Prisión Menor».

Análisis de contenido de los protocolos (deliberaciones)

Las deliberaciones se sometieron a un análisis de contenido, tomando como unidad de análisis cada intervención verbal individual.

Estos mensajes verbales fueron categorizados sobre la base de quién era el interlocutor y el contenido de la misma. Las categorías de códigos de mensajes constaban de seis dígitos en los que se identificaba al interlocutor (dígito 1); se definían los contenidos de la deliberación, o las argumentaciones sobre los hechos (dígito 2); las argumentaciones de derecho (dígito 3); se aludía a la fiabilidad de los testimonios (dígito 4); a la validez de las diversas pruebas (dígito 5); y la valencia de cada intervención, esto es, la calificación, como positiva, negativa o neutra para el acusado (dígito 6). Estas orientaciones de los dígitos fueron tomados, para el estudio de los contenidos, de Hastie, Penrod y Pennington (1986) y Fariña, Arce y Vila (1999); y para el estudio de la valencia de las intervenciones de Tanford y Penrod (1990). Mediante la evaluación de la fiabilidad de los distintos testimonios y de la validez de las pruebas, medimos las dimensiones «fiabilidad» y «validez», recogidas en los «Modelos de Integración de la Información» que se han propuesto como un referente válido para la explicación de la formación de juicios legales individuales (p.e., Ostrom, Werner y Saks, 1978), tanto de jueces (Arce et al., 2001) como de jurados (Arce, Fariña y Real, 2000), pero nunca se han estudiado desde una perspectiva de discusión grupal.

Para la concreción de las categorías de contenido, tomando como base los sistemas anteriormente descritos, procedimos con un método de aproximaciones sucesivas tras el estudio de los protocolos. Para la concreción final de las categorías seguimos las normas redactadas al respecto por Anguera (1990). Así, creamos un sistema categorial mutuamente excluyente, fiable y válido, en lo que Weick (1985) ha denominado sistemas de categorías metódicas. Las categorías resultaron de la siguiente forma:

Dígito 1: identificación del sujeto que interviene. Para las deliberaciones de los Tribunales de Jueces 1, 2, 3, y para las deliberaciones de los Tribunales de Jurados de 1 a 9.

Dígito 2: argumentaciones sobre los hechos:

01. No hace referencia a los hechos del caso.
02. Hechos acaecidos.
03. Suposición de hechos.
04. Justificación de la causa.
05. Historia personal del acusado.
06. Anécdotas personales.
07. Intervención del fiscal.
08. Intervención de la defensa.
09. Intervención acusación particular.
10. Intervención forense/peritos.
11. Intervención acusado.
12. Intervención víctima.
13. Intervención testigos defensa.
14. Intervención testigos acusación.

Dígito 3: argumentaciones de derecho:

00. No refiere a derecho.
01. Detalles legales.
02. Atenuantes.
03. Agravantes.
04. Eximentes.
05. Petición de pena.
06. Consecuencia penal.
07. Intención de veredicto.
08. Definición de delito.
09. Formulación de conjeturas.
10. Carga de la prueba e In dubio pro reo.
11. Responsabilidad criminal.
12. Otros casos.
13. Peligrosidad criminal.

Dígito 4. Estimación de la fiabilidad de las pruebas:

01. Credibilidad acusado.
02. Credibilidad víctima.
03. Credibilidad peritos/forenses.
04. Credibilidad de los testigos de la defensa.
05. Credibilidad de los testigos de la acusación.

Dígito 5. Estimación del valor probatorio de las pruebas (el total de pruebas fue recodificado de modo que fueran universales para los tres casos utilizados):

01. No hace referencia pruebas del caso.
02. Armas.
03. Atribuciones al estado mental del acusado.
04. Importancia del testimonio del acusado.
05. Importancia del testimonio de la víctima.
06. Importancia del testimonio de peritos.
07. Importancia del testimonio del psicólogo.
08. Importancia de los testigos de la defensa.
09. Importancia de los testigos de la acusación.
10. Importancia de los informes periciales.

Dígito 6. Valencia de la intervención, esto es, dirección de la intervención para el acusado:

01. Positiva: pro-acusado.
02. Negativa: contra-acusado.
03. Neutra.

Fiabilidad

Las deliberaciones fueron codificadas por un codificador entrenado exhaustivamente. Además, un segundo codificador catalogado como fiable en otras codificaciones (Jólluskin, 2000) evaluó parte del material para contrastar la fiabilidad del codificador principal. Concretamente y con estos dos codificadores, computamos dos modos de fiabilidad: una intra-codificador y otra inter-codificador, a partir del 10% de las deliberaciones de ambos grupos muestrales, Tribunales de Jueces y de Jurados. Para obtener la consistencia intra-codificador se dejó transcurrir un mes entre la codificación original y la recodificación. Para el cómputo, usamos el estadístico «Kappa» de Cohen que contiene un índice corrector de los aciertos producidos al azar.

Los valores obtenidos ponen de manifiesto que la consistencia en las diversas medidas es buena tanto inter- como intra-codificador (véase la Tabla 1).

Además, en pos de establecer la fiabilidad más allá de los instrumentos, también es de destacar que éstos se han mostrado fiables, efectivos y válidos en otros estudios así como consistentes con otros métodos (p.e., Arce et al., 1996; Arce et al., 2001, Jólluskin, 2000). En consecuencia, considerando esta consistencia inter-sujetos, inter-estudios e inter-métodos, se puede afirmar que los registros obtenidos son fiables (Wicker, 1975).

Análisis de datos

Los análisis de las deliberaciones se realizaron a través de las asignaciones de dígitos a cada una de las intervenciones de los jurados/jueces. Así, cada dígito o categoría se convierte en una variable. Una cuestión clave radica es fijar a estas variables una condición de variables discretas, esto es, frecuencias o de variables continuas. Tradicionalmente se las ha considerado como variables continuas (i.e., Hastie, Penrod y Pennington, 1986), previsiblemente por la mayor potencia de los análisis consiguientes. Para nuestros propósitos concretos también es de mayor interés tomar estas variables como continuas. En consecuencia, hemos tomado una medida precautoria que nos garantiza que se trata de variables continuas: su transformación en continuas por el método de raíz cuadrada. Así se homogeneizan las varianzas, estabilizándose aproximadamente en σ2=1 si la media de las observaciones originales es >.8, como en nuestro caso (Dixon y Massey, 1983, p. 373). No obstante, las medias presentadas en las tablas se corresponden a las puntuaciones directas para que se pueda tener un conocimiento directo del impacto numérico de las variables. En relación con las pruebas multivariadas optamos por la Traza de Pillia-Bartlett, ya que es más robusta ante la heterogeneidad de las matrices de varianza (Olson, 1976).

Además, computamos un constructo cognitivo que nos indica la rigidez en los contenidos de la discusión: la redundancia (v.gr., Arce et al., 1999; Fariña, Arce y Vila, 1999). La transcendencia de este constructo radica en que un debate redundante en cuanto al contenido presenta menos valor que otro más equilibrado, por la mayor profundidad y ecuanimidad de la deliberación. Ésta se obtiene a partir de la siguiente fórmula, redundancia= S [fo - fe].

En relación con el estudio de la consistencia de los veredictos de los Tribunales de Jueces y Jurados, procedimos con un contraste de los porcentajes más elevados, decisión modal, con un valor dado, a través de la transformación en puntuaciones «Zeta». Como valor dado con el que contrastar el valor empírico tomamos .80 (o sea, el 80%), punto que Tversky (1977) estima como aquel a partir del cual se puede decir que los juicios son concordantes.

Resultados y conclusiones

Estudio del veredicto grupal

En el caso I, los Tribunales de Jueces llegaron todos a la conclusión unánime de «asesinato frustrado con la estimación de una eximente parcial». Esto es, la concordancia en la decisión fue del 100% y se corresponde con las demandas de la fiscalía. Por su parte, los Tribunales de Jurados alcanzaron esa misma decisión unánime, «asesinato frustrado con la estimación de una eximente parcial», en dos deliberaciones (40% de los Jurados), Z(n= 45)= 6.67; p<.001; en tanto en otras dos la calificación fue de «asesinato frustrado con eximente completa» (40% de los Jurados, calificación de la defensa), Z(n= 45)= 6.67; p<.001; y finalmente un Tribunal de Jurado alcanzó la decisión más punitiva, «asesinato» (20%, petición de la acusación particular). En consecuencia, la deliberación de los Tribunales de Jurados, lejos de llevar la conclusión hacia una homogeneización de criterios, tal y como ocurre con el sistema tradicional de decisión en el marco de una justicia de adversarios en el que se les demanda un veredicto bien de inocencia bien de culpabilidad (Fariña, Arce y Vila, 1999), los condujo hacia una disparidad de criterios. En suma, la deliberación llevó a los Tribunales de Jurados a una ejecución inconsistente internamente.

Los Tribunales de Jueces, en el caso de la Acusación contra J.C.O., llegaron a la decisión de «amenazas», calificación de la defensa, en tres deliberaciones (60%), Z(n= 15)= 18.18; p<.001; uno a «homicidio en grado de tentativa parcial», petición de la fiscalía, (20%); y un último a «homicidio en grado de tentativa completa», demanda de la acusación particular, (20%). La dispersión en los Tribunales de Jurados es todavía mayor. Así, dos concluyeron «amenazas» (40%), Z(n= 45)= 6.67; p<.001; uno en «homicidio en grado de tentativa parcial» (20%); uno en «homicidio en grado de tentativa completa» (20%); y un último se declaró irresoluble (20%). Estamos pues ante decisiones no consistentes intra-grupos decisionales, tanto entre Tribunales de Jueces como de Jurados.

En el caso contra F.M.C., los Tribunales de Jueces calificaron el mismo, en tres deliberaciones, de «asesinato frustrado con enajenación mental» (60%, calificación de la fiscalía) Z(n= 15)= 18.18; p<.001; uno sentencia el caso como «lesiones con apreciación de enajenación mental» (20%, calificación de la defensa); en tanto un último lo califica de «asesinato frustrado» (20%, calificación acusación particular). Los Tribunales de Jurados, por su parte, llegaron a una decisión de «asesinato frustrado con enajenación mental» en dos deliberaciones (40%, calificación de la fiscalía) Z(n= 45)= 6.67; p<.001; otros dos calificaron los hechos como «lesiones con apreciación de enajenación mental» (40%, calificación de la defensa); y uno llegó a la conclusión de «inocencia», demanda de la defensa, (20%). De nuevo, nos encontramos ante una muestra de inconsistencia decisional aplicable, en este caso, tanto a Tribunales de Jueces como de Jurados.

Considerando los tres casos en su conjunto, encontramos que las decisiones de los Tribunales de Jueces están en línea con los postulados de la fiscalía, 60%, χ2(2,n= 45)= 15.6; p<.001, en tanto las de los Jurados se decantan más por las estimaciones de la defensa, 50%, χ2(2,n= 126)= 24.43; p<.001.

Longitud de la discusión y capacidad argumentativa

Existen dos modos de entender la duración de una deliberación, bien haciendo referencia al tiempo empleado bien a la cantidad de intervenciones. Nosotros optamos por la segunda ya que refleja más fehacientemente la actividad de tipo argumentativo desplegada. Pues bien, los resultados muestran que los Tribunales de Jurados (M= 186.133) llevan a cabo deliberaciones con más intervenciones que los Tribunales de Jueces (M= 71.2), F(1,28)= 10.066; MC= 99072.533; p<.001; T.E.= .264. No obstante, esto no supone que exista una mayor capacidad argumentativa, ya que en las decisiones judiciales los grupos de mayor tamaño presentan discusiones más largas (Fariña, Arce y Vila, 1999). De hecho, encontramos que las intervenciones de los Tribunales de Jurados (M=143.67) están más desligadas de menciones a hechos del caso que las de los Jueces (M= 58), F(1,28)= 9.034; p<.01; MC= 55040.833. Asimismo, en el estudio de las relaciones con la motivación legal del caso, los Tribunales de Jurados (M= 133) muestran más intervenciones desligadas de nexos legales que las de los Tribunales de Jueces (M= 42.47), F(1,28)= 10.571; p<.01; MC= 61472.133; T.E.= .274. Por último, los resultados en relación con los nexos entre intervención y pruebas, informan que los Tribunales de Jurados (M=164) realizan más intervenciones libres de vinculación con la valoración y estimación de fiabilidad de las pruebas que las de los Jueces (M= 60.33), F(1,28)= 11.4121, p<.01; MC= 80600.833; T.E.= .29. En resumen, si bien los Tribunales de Jurados emiten más intervenciones en el transcurso de la deliberación, éstas están más vacías de contenido que las de los Jueces.

Todo ello nos lleva a preguntarnos, sobre la base de que las deliberaciones de los Tribunales de Jurados son más largas, si esto implica realmente que sean más productivas. De suyo, bien pudiera ocurrir que se focalizaran excesivamente en unas categorías de discusión en detrimento de otras, o sea, que fueran redundantes. Los resultados en esta dirección (véanse en la Tabla 2) apuntan que las deliberaciones de los Tribunales de Jurados son más redundantes tanto en los hechos del caso, como en la valoración legal o las referencias a pruebas; o sea, que no desmenuzan los contenidos por un igual, sino que se centran en unos en detrimento de otros. En consecuencia, en este caso concreto, mayor longitud no es sinónima de mayor calidad en términos de estudio equitativo de los factores legales (v.gr., hechos, pruebas y nexos legales). En suma, los Tribunales de Jurados parecen focalizar la discusión hacia algunos contenidos en los que inciden en demasía obviando otros igualmente importantes.

Argumentaciones sobre los hechos

Los resultados en relación con el contenido de los hechos del juicio ponen de manifiesto que Tribunales de Jueces y Jurados discuten por un igual en relación con los hechos, Fmultivariada(13,16)= 1.497; ns; T.E.= .546. No obstante, el estudio de los efectos univariados (obsérvense en la Tabla 3) nos informa que existen diferencias significativas en las variables «referencia a los hechos acaecidos» y «suposiciones de hechos». En ambas, los Tribunales de Jurados inciden más que los de Jueces. Las implicaciones son distintas para cada categoría de análisis. Así, si bien los Tribunales de Jurados dan entrada a una discusión sobre la evidencia legal de orden factual a través de las menciones a los «hechos acaecidos», también dan cabida a mayor entrada a la evidencia extralegal a través de las «suposiciones de hechos». En consecuencia, se apartan, en buena medida, más que los Tribunales de Jueces del objeto de la deliberación al ahondar en la evidencia extralegal.

Argumentaciones de derecho

En el estudio de las argumentaciones legales, comprobamos nuevamente que Tribunales de Jueces y Jurados ejecutan por un igual, en este caso, en relación con los recursos legales asociados a las intervenciones, Fmultivariada(13,16)= 1.362; ns; T.E.= .525.

Ahora bien, los efectos univariados, que pueden consultarse en la Tabla 4, informan que los Tribunales de Jurados dirigen más sus intervenciones a la «intención de veredicto», a la «formulación de conjeturas legales», y al «análisis de las consecuencias penales». En resumen, los Tribunales de Jurados muestran una mayor orientación al veredicto; a establecer suposiciones o deducciones de tipo legal que es preciso tener en mente que requieren de conocimientos legales específicos que no poseen; y a realizar inferencias legales sobre el tipo de pena que no les son propias de acuerdo con nuestro ordenamiento jurídico (v. gr., Ley Orgánica 5/1995 de Tribunal del Jurado). Así pues, las deliberaciones de los Tribunales de Jurados presentan un vicio de orientación a la decisión que se contrapone, por naturaleza de las dinámicas de discusión, a una «orientación a las pruebas», que da lugar a decisiones de más calidad (Hastie, Penrod y Pennington, 1986).

Discusión sobre la fiabilidad de los testimonios

Los resultados muestran que también la dimensión «fiabilidad de la evidencia» es objeto de la deliberación por un igual entre Tribunales de Jueces y Jurados, Fmultivariada(4,25)= .429; ns; T.E.= .137. Asimismo, los efectos univariados informan que ninguna de las variables de medida de la fiabilidad se usa de un modo distinto en las deliberaciones de los Tribunales de Jueces y Jurados (compruébense los datos en la Tabla 5).

Discusión sobre la validez de las pruebas

Tampoco encontramos diferencias significativas entre los Tribunales de Jueces y Jurados en los contenidos de las discusiones sobre el valor probatorio de las diversas pruebas aportadas en el juicio, Fmultivariada(9,20)= 1.669; ns; T.E.= .568. Esto es, los Tribunales de Jueces y Jurados tratan por un igual la valoración del peso de las pruebas del caso para la decisión a tomar en las discusiones grupales. Por su parte, los efectos univariados, que pueden consultarse en la Tabla 6, informan que los Tribunales de Jurados realizan más referencias a las «armas descritas en los hechos» como prueba del caso. En suma, todo parece indicar que, con relación a los nexos de las intervenciones con la estimación del valor de las pruebas del caso, las diferencias son menores entre Jueces y Jurados, ya que recaen en una única prueba. Posiblemente, esta mayor incidencia responda al rol estresor de las armas para los legos, dado que, en consonancia con los hallazgos de los estudios realizados con testigos visuales, las armas llevan a que la situación se vuelva ansiógena, deteriorando la ejecución (p.e., Johnson y Scott, 1976; Tooley et al., 1987; Maas y Köhnken, 1989).

Estudio de la valencia de la intervención

Aisladamente, los Tribunales de Jueces (contingencias en Tabla 7) presentan una mayor tendencia en sus intervenciones contrarias al acusado, χ2(2,n= 1078)= 178.293; p<.001, en perjuicio de intervenciones favorables al inculpado o neutras. En otras palabras, las deliberaciones se orientan en contra del encausado.

Por su parte, los Tribunales de Jurados (para conocer de las contingencias acúdase a la Tabla 7) evidencian una tendencia en sus intervenciones superior a la esperada, tanto a favor como en contra del acusado, en perjuicio de intervenciones neutras, esto es, se «orientan a la decisión», χ2 (2,n= 2769)= 331.033; p<.001.

Estratégicamente, el proceder de los Tribunales de Jurados se sigue de «una integración de las versiones», no de un proceso de exclusión, tal y como se vería reflejado si ésta fuera, de suyo, mayor, bien a favor o bien en contra del acusado. Por el contrario, los Jueces proceden con una estrategia de «exclusión de la información» favorable al encausado. O sea, se orientan a la culpabilidad.

Las implicaciones y alcance de los resultados aquí mostrados son limitadas. Así, no podrán generalizarse a otros contextos legales porque el modo de ejecución del Jurado español no es homologable con los otros disponibles. Además, circunscribiéndonos al caso español, los resultados deben tomarse con cierta cautela porque si bien es cierto que estamos ante una simulación de alta fidelidad, no lo es menos que, con cierta frecuencia, este tipo de resultados no son iguales a los que se obtienen en un contexto real o de archivo (p.e., Konecni y Ebbensen, 1992). Es, por tanto, preciso proceder con más estudios en esta línea para delimitar con mayor exactitud el alcance de las implicaciones que vamos a formular. Hechas estas salvedades, formulamos las siguientes conclusiones a partir de los resultados aquí mostrados. Primero, las decisiones judiciales, tanto de los Tribunales de Jueces como de Jurados, se apartan de un objetivo central, la consistencia inter-evaluadores. Esta conclusión es especialmente robusta en el caso de los Jurados. En consecuencia, las deliberaciones no cumplen con el papel asignado: control de sesgos a través de la homogeneización de juicios (Kaplan y Miller, 1978). Además, téngase presente que nuestro ordenamiento jurídico cuenta con el principio de libre valoración de la prueba, que excluye cualquier sujeción a otro criterio que no sea el propio tribunal que juzga. Segundo, en relación con las tendencias de juicio, los Tribunales de Jueces muestran, en consonancia con los resultados de otros estudios de archivo de sentencias españolas, un efecto de anclaje decisional de las mismas en las demandas de la fiscalía (Garrido y Herrero, 1995; Arce, Fariña y Novo, 1996; Fitzmaurice y Pease, 1986; Fariña, Novo y Arce, 2002). Por el contrario, los Tribunales de Jurados se decantan hacia las demandas de la defensa. En suma, mientras los Tribunales de Jueces están orientados hacia «las demandas de la acusación», los Tribunales de Jurados lo están hacia «las demandas de la defensa». Viene a ser ésta una demostración más (v. gr., MacCoun y Kerr, 1988) de la tendencia de sesgo de los juicios de los legos hacia las tesis de la defensa y de los profesionales hacia las de la acusación. Tercero, las deliberaciones de los Tribunales de Jurados no implican una discusión más profunda sobre los contenidos con la que compensar la falta de experiencia, conocimientos y formación en relación con los tribunales togados. Así, si bien las deliberaciones de los Tribunales de Jurados son más largas, no están más «orientadas a los contenidos». Inesperadamente, las deliberaciones de los Tribunales de Jurados están más vacías de contenidos. Cuarto, los Tribunales de Jurados tampoco realizan una estimación más profunda de la fiabilidad de los testimonios ni del valor probatorio de las pruebas aportadas. Este resultado es contrario a lo esperado ya que se preveía una discusión más profunda con la que compensar su menor capacitación. Quinto, las deliberaciones de los Tribunales de Jueces no muestran un esperado mayor impacto, dada su formación, en nociones legales. Ahora bien, este dato no es determinante, ya que pueden darse por implícitas (v.gr., las referencias a la jurisprudencia ya suponen la asunción de todo el contenido legal inmerso en ese caso) y, además, las referencias de los Tribunales de Jurados no son propiamente de valor legal, sino que se centran en «conjeturas legales»; asociaciones con la «intención de veredicto»; y «suposiciones sobre las consecuencias penales», lo que no es objeto de su intervención de acuerdo con la ley. Sexto, en consonancia con las decisiones grupales, la valencia de la intervención pone de manifiesto que las deliberaciones de los Tribunales de Jueces están más «orientadas en contra del acusado», en tanto las de los Tribunales de Jurados parecen seguir un proceso de «integración de la versión favorable y contraria al encausado». Este dato es un indicador de que las diferencias en las decisiones entre Tribunales de Jueces y Jurados no sólo están en términos del veredicto (p.e., Tanford y Penrod, 1990; Arce, 1995), sino que van más allá, afectando a la valoración de las pruebas, más contrarias al encausado entre los Jueces. Además, y en línea con los hallazgos de Tanford y Penrod (1990), las intervenciones, tanto de Tribunales de Jueces como de Jurados, presentan un nexo directo con el objeto del veredicto a través de la valencia favorable o contraria al encausado. Esto es, se «orientan a la tarea». Séptimo, en términos de actividad cognitiva, las deliberaciones legas muestran una mayor actividad, pero ésta no es todo lo efectiva que cabría al ser más redundante, o sea, no discuten de los hechos, pruebas y argumentos legales tan homogéneamente como los Jueces sino que redundan en algunas categorías en detrimento de otras. Octavo, a tenor de todo lo anterior podemos concluir que Tribunales de Jurados y de Jueces ejecutan tareas distintas.

En suma, observamos bastantes indicios de una ejecución no adecuada en los Tribunales de Jueces y Jurados, aunque más en estos últimos, que podrían subsanarse tomando medidas tales como la instrucción sobre los déficit que presentan en su ejecución. No obstante son necesarios estudios ad hoc para poder encontrar las soluciones más adecuadas. Mientras tanto, nosotros proponemos un entrenamiento de los decisores en las fuentes de sesgo a fin de que puedan abordar el déficit metacognitivo que se les presupone y que se ha identificado como una de las fuentes de anomalías en el razonamiento informal (Perkins, 1989). Esto es, creemos que un primer paso para amortiguar estas muestras de una ejecución no normativa es advertir a los actores implicados de las mismas para que se autocorrijan. En relación a la práctica profesional, de ser potestativo el recurso al Jurado, éste sería más proclive a los intereses de la defensa en tanto los Tribunales de Jueces lo serían para la acusación. Asimismo, las estrategias de persuasión no son iguales para legos y técnicos ya que se focalizan en ítems de evidencia distintos.

Nota

1 . Los nombres y lugares fueron cambiados para que no se pueda identificar el caso real. Con relación a las diferentes calificaciones presentamos, ad literam, una transcripción directa de las mismas, incluyendo la jerga legal al respecto. Los hechos sólo se recrean según la descripción original de la Fiscalía y las diferentes matizaciones de las otras partes.

Anguera, Mª T. (1990). Metodología observacional. En J. Arnau, Mª. T. Anguera, y J. Gómez (Eds.), Metodología de la investigación en las ciencias del comportamiento (pp. 125-236). Murcia: Servicio de Publicaciones de la Universidad de Murcia.

Arce, R. (1995). Evaluating evidence on jury decision making. En R. Bull, y D. Carson (Eds.), Handbook of psychology in legal context (pp. 565-580). Londres: John Wiley and Sons.

Arce, R., Fariña, F., Novo, M. y Real, S. (1996). Cognition and judicial decision making. International Journal of Psychology, 31(3-4), 93.

Arce, R., Fariña, F., Novo, M. y Seijo, D. (1999). In search of causes of hung juries. Expert Evidence, 6, 243-260.

Arce, R., Fariña, F., Novo, M. y Seijo, D. (2001). Judges’ decision-making from within. En R. Roesch, R. R. Corrado, y R. J. Dempster (Eds.), Psychology in the courts: International advances in knowledge (pp. 195-206). Nueva York: Routledge.

Arce, R., Fariña, F. y Real, S. (2000). The assessment of information integration theory and confirmatory bias hypothesis on judicial proceedings. A case of rape and murder. En A. Czerederecka, T. Jaskiewic-Obydzinska, y J. Wójcikiewicz (Eds.), Forensic psychology and law (pp. 296-303). Cracovia: Institute of Forensic Research Publishers.

Baldwin, J. y McConville, M. (1979). Jury trials. Londres: Oxford University Press.

Chin, A. y Peterson, M.A. (1985). Deep pockets, empty pockets: Who wins in Cook Country jury trials? Santa Monica, CA.: The Rand Corporation.

Diamond, S.S. y Zeisel, H. (1975). Sentencing council: A study of sentence disparity and its reduction. University of Chicago Law Review, 43, 109-149.

Dixon, W.J. y Massey, F.J. Mr. (1983) (4ª ed.). Introduction to statistical analysis. Nueva York: MacGraw-Hill.

Konecni, V.J. y Ebbensen, E.B. (1992). Methodological issues on legal decision-making, with special reference to experimental simulations. En F. Lösel, D. Bender, y T. Bliesener (Eds.), Psychology and law. International perspectives (pp. 413-423). Berlín: Walter de Gruyter.

Elwork, A., Sales, B.D. y Alfini, J.J. (1977). Juridic decisions: In ignorance of the law or in light of it? Law and Human Behavior, 1, 163-189.

Fariña, F., Arce, R. y Vila, C. (1999). Efectos de la composición del jurado en los estilos deliberativos, análisis cognitivo y de contenido de la deliberación. Anuario de Psicología, 30(1), 105-122.

Fariña, F., Novo, M. y Arce, R. (2002). Heurístico de anclaje en las decisiones judiciales. Psicothema, 14(1), 39-46.

Fitzmaurice, C. y Pease, K. (1986). The psychology of judicial sentencing. Manchester: Manchester University Press.

Garrido, E. y Herrero, C. (1995). Fiscales y jueces: Concordancia entre percepción y realidad. En E. Garrido, y C. Herrero (Comps.), Psicología política, jurídica y ambiental (pp. 269-281). Salamanca: Eudema.

Hastie, R., Penrod, S.D. y Pennington, N. (1986). La institución del jurado en los Estados Unidos. Sus intimidades. Madrid: Cívitas (Orig. 1983).

Heuer, L. y Penrod, S.D. (1994). Trial complexity. A field investigation of its meaning and effects. Law and Human Behavior, 18(1), 29-51.

Johnson, C. y Scott, B. (1976, septiembre). Eyewitness testimony and suspect identification as a function of aruosal, sex of witness, and scheduling of interrogation. Comunicación presentada a la 18th Annual Convention of the American Psychological Association, Washington, D.C.

Jólluskin, G.S. (2000). Influencia social mayoritaria y minoritaria, y decisiones de jurados. Tesis doctoral, Universidad de Santiago de Compostela.

Kalven, H. Jr. y Zeisel, H. (1966). The American jury. Boston: Brown.

Kaplan, M.F. y Miller J. H. (1978). Reducing the effects of juror bias. Journal of Personality and Social Psychology, 36, 1.443-1.455.

Kapardis, A. (1985). Sentencing by English magistrates as a human process. Nicosia, Chipre: Asselia Press.

Kapardis, A. (1997). Psychology and law: A critical introduction. Cambridge: Cambridge University Press.

Maas, A. y Köhnken, G. (1989). Eye-witness identification: Simulating the «weapon effect». Law and Human Behavior, 13, 397-408.

MacCoun, R.J. y Kerr, N.L. (1988). Asymmetric influence in mock jury deliberation: Jurors’ bias for leniency. Journal of Personality and Social Psychology, 54(1), 21-33.

Myers, M.A. (1979). Rule departures and making law: Juries and their verdicts. Law and Society Review, 13, 781-797.

Olson, C.L. (1976). On choosing a test statistic in manova. Psychological Bulletin, 83, 579-586.

Ostrom, T.M., Werner, C. y Saks, M.J. (1978). An integration theory analysis of jurors’ presumptions of guilt or innocence. Journal of Personality and Social Psychology, 36, 436-450.

Partdridge, A. y Eldridge, W. (1974). The second circuit sentencing study. Nueva York: Federal Judicial Center.

Perkins, D.N. (1989). Reasoning as it and could be: An empirical perspective. En D. M. Topping, D. C. Crowell, y V. N. Kobayaski (Eds.), Thinking across cultures: The third international conference on thinking. Hillsdale, N. J.: LEA.

Sobral, J. y Prieto, A. (1994). Psicología y ley. Un examen de las decisiones judiciales. Madrid: Eudema.

Sutton, L. (1978). Variations in federal criminal sentences: A statistical assessment at the national level. Washington, D.C.: National Criminal Justice Information and Statistics Service.

Tanford, S. y Penrod, S. (1990). Las deliberaciones del Jurado: Contenido de la discusión y procesos de influencia en la toma de decisiones de un Jurado. Estudios de Psicología, 42, 75-97 (Orig. 1986).

Tooley, V., Brigham, J.C., Maas, A. y Bothwell, R.K. (1987). Facial recognition: Weapon effect and attentional focus. Journal of Applied Social Psychology, 17, 845-859.

Tversky, A. (1977). Features of similarity. Psychological Review, 84, 327-352.

Weick, K.E. (1985). Systematic observational methods. En G. Lindzey, y E. Aronson (Eds.), The handbook of social psychology (vol. 1) (pp. 567-634). Hillsdale, N.J.: LEA.

Wicker, A.W. (1975). An application of a multipletrait-multimethod logic to the reliability of observational records. Personality and Social Psychology Bulletin, 4, 575-579.

Factor de Impacto 2022:  JCR WOS 2022:  FI = 3.6 (Q2);  JCI = 1.21 (Q1) / SCOPUS 2022:  SJR = 1.097;  CiteScore = 6.4 (Q1)