miércoles, 2 de noviembre de 2011

Paro, fracaso y PISA


El pasado día salieron los datos de la Encuesta de Población Activa que nos dejaban al borde de los cinco millones de parados o, dicho de otra manera, un 21,5% de las personas que quiere trabajar no encuentra quien lo contrate. Es una burrada sin parangón en el mundo al que queremos pertenecer, tanto en evolución como en números brutos. Algo estamos haciendo muy mal para estar así, pero como no sé demasiado del tema, me abstendré de comentarlo.
Lo que sí sé es que, tal y como se puede ver en esta tabla, la edad y el nivel de estudios son dos factores importantes de protección frente al paro.

Paro por edad y nivel de estudios (2011T3)

Bajos
Medios
Altos
Total








Todos
23,4
15,3
11,8
21,5








De 16 a 19 años
57,3
17,7
--
56,0








De 20 a 24 años
41,2
33,8
37,2
39,6








De 25 A 29 años
26,8
19,4
21,4
24,2








De 30 a 34 años
24,7
14,7
12,8
19,4








De 35 a 39 años
22,5
13,1
11,1
17,6








De 40 a 44 años
21,4
12,9
8,8
16,7








De 45 a 49 años
18,4
12,3
6,5
14,6








De 50 a 54 años
15,8
10,9
6,3
12,7








De 55 a 59 años
14,8
11,2
7,1
12,3








De 60 a 64 años
15,3
12,8
4,6
11,4








Fuente: Elaboración propia sobre datos de la EPA (2011T3).

Según avanzamos en edad el paro disminuye, muy rápidamente al principio, poco a poco más tarde. Probablemente no es la edad/experiencia la protectora, sino la duración del contrato y la indemnización aneja. Pero el nivel de estudios es evidente: a los 30-34 años el paro es el doble entre los que tienen estudios bajos (sin Secundaria superior, es decir, Bachillerato y FP media) que entre los que tienen estudios medios (Secundaria superior) o altos (universitarios o FP Superior); a los 40-45 años, los que tienen estudios medios tienen el doble de paro que los que tienen un nivel alto de estudios, y los que tienen estudios bajos tienen el triple de paro que estos últimos.

En general, uno de cada cuatro personas con nivel bajo de estudios está en paro, frente a una de cada siete con estudios medios y una de cada nueve con estudios altos. No es difícil ver que con una proporción menor de población con Secundaria superior no tendríamos el paro que tenemos.

Con los jóvenes (por debajo de los 30) el nivel de estudios no está funcionando tan bien. Aunque antes de los 25 hay una población de estudiantes que altera los resultados (el paro se calcula sobre población activa, y los estudiantes se consideran en general inactivos), en el tramo 25-29 apenas hay diferencias entre unos y otros. Puede ser porque no hay trabajo para ninguno de los que empiezan o por una perversión de los contratos temporales, no lo sé.

Quizás sea ilustrativo recordar cómo estábamos hace cinco años, cuando había quienes decían que estudiar en España no compensaba:

Paro por edad y nivel de estudios (2006T3)

Bajos
Medios
Altos
Todos








Todos
10,0
7,7
5,8
8,1








De 16 a 19 años
26,4
19,7
--
24,9








De 20 a 24 años
14,4
14,4
14,8
14,5








De 25 a 29 años
11,3
8,3
8,9
9,5








De 30 a 34 años
10,9
6,9
5,7
7,8








De 35 a 39 años
8,8
6,6
5,1
7,0








De 40 a 44 años
8,7
5,8
4,0
6,5








De 45 a 49 años
7,8
4,0
2,9
5,6








De 50 a 54 años
7,5
5,9
2,4
5,9








De 55 a 59 años
7,1
5,2
3,1
5,9








De 60 a 64 años
5,5
4,5
2,4
4,8








Fuente: Elaboración propia sobre datos de la EPA (2006T3).

Para los que tienen cierta edad, el paro se ha duplicado para los que tienen un nivel alto de estudios, pero se ha multiplicado por 2,5 o por tres para los que tienen un nivel bajo de estudios. Uno de los datos evidentes de la comparación entre ambas tablas es que cada vez menos gente está protegida por contratos largos, especialmente entre los que tienen un bajo nivel de estudios. No sé si los sindicatos habrán tomado nota de esto.

Como el fracaso escolar en España es el responsable del nivel bajo de estudios de los jóvenes, me puse a cruzar datos de paro y fracaso por comunidades autónomas. Para empezar, una tabla de correlaciones:

Correlaciones entre los valores medios de las 17 CCAA (sin Ceuta y Melilla)

Paro
Paro joven (16-24 años)
Fracaso escolar
Matemáticas (PISA 2009)
Media años estudio

Paro
1,000
0,805
0,719
-0,821
-0,745

Paro joven (16-24 años)
0,805
1,000
0,702
-0,537
-0,481

Fracaso escolar
0,719
0,702
1,000
-0,694
-0,588

Matemáticas (PISA 2009)
-0,821
-0,537
-0,694
1,000
0,607

Media años estudio
-0,745
-0,481
-0.588
0,607
1,000

FUENTE: Elaboración propia sobre la EPA (2011T3) y PISA 2009.
Notas: El paro está calculado sobre la población activa, pero el paro juvenil sobre la población total. El fracaso es la media de los diez últimos años. La media de años de estudio está calculado sobre la población entre 25 y 64 años.

[Para el que no lo sepa, una correlación es un número entre -1 y 1 que indica el grado de asociación entre dos variables: si se acerca a cero, no están relacionadas; si se acerca a uno, están relacionadas de manera que a medida que crece una, crece la otra; y si se acerca a -1 están también relacionadas, pero de manera que si crece una la otra decrece].

Comencemos con una serie de notas técnicas para saber qué significa cada denominación. Para empezar, se han correlacionado los valores medios de cada variable en cada una de las comunidades autónomas, salvo Ceuta y Melilla, no tanto por su tamaño como por los valores extremos que suelen tener (lo que distorsiona no poco las correlaciones), y sin ponderación de ninguna clase. El paro es el porcentaje de población activa que no tiene trabajo, la definición habitual, pero para el paro juvenil se ha empleado el porcentaje de parados sobre la población general, ya que entre los 16 y los 24 la definición anterior deja fuera a los estudiantes, lo que baja todas las correlaciones y puede confundir. El fracaso escolar es la tasa bruta de población que no ha obtenido el título de ESO en los diez últimos años disponibles (2000-2009). Matemáticas es la puntuación media de las comunidades en PISA 2009 en la escala de Matemáticas: la utilizo porque es la más fiable y estable (por cierto, está la puntuación de las 17, aunque en las tres que se presentaron sin muestra ampliada la media es menos fiable). Por fin, la media de años de estudio es un indicador del nivel de estudios de la población adulta (30-64 años), y se ha calculado tras otorgar a cada nivel de estudios unos años estimados de escolarización (como aquí) y calculando posteriormente la media.

Pero vamos con la tabla. Lo primero que sorprende es que la correlación más alta (0,821) se de entre dos variables que no pueden estar relacionadas directamente: el paro de toda la población y los resultados de PISA en Matemáticas (que se miden en chavales que hoy tienen 17 años). La segunda se da entre el paro general y el paro juvenil (0,805, esperable, conociendo España) y la tercera entre la media de años de estudio (que es el nivel educativo medio de la población mayor de 30 años) y el paro (-0,745, también esperable, pues hemos visto en la primera tabla que a menor nivel de estudios, más paro) y a continuación una serie de correlaciones muy parecidas, entorno a 0,7, que son las del fracaso escolar con el paro, el paro joven y Matemáticas en PISA.

Vamos a analizar con cuidado la primera correlación (resultados en PISA, tasa de paro). En el siguiente gráfico se puede ver cómo se relacionan ambas variables por CCAA (no se incluyen en los cálculos Ceuta y Melilla, aunque sí están representadas en un color más claro):
















Lo que el gráfico nos estaría diciendo es que el 67% de la tasa de paro podría explicarse por el nivel en PISA de sus jóvenes. Como tal explicación es un absurdo, habría que colegir que hay es una variable latente que explicaría ambas cosas: nivel de estudios de los jóvenes y tasa de paro. Una candidata podría ser el nivel de estudios general de la población en las CCAA, pero ya la incluimos en la tabla de correlaciones, y no parece dar la talla. Por tanto, habría otra variable latente, que probablemente incluría el nivel de estudios, el poder adquisitivo, valoración de la cultura, inclinación hacia el progreso a través del estudio, y un largo etcétera.

Probablemente algo de esto haya, lo que la gente tiene en la cabeza explica mucho de lo que pasa (porque está detrás de las decisiones que toma), y lo que la gente tiene en la cabeza tiene detrás una larga tradición histórica, a veces de siglos (creo que, en este sentido, hay una entidad geográfica, la comarca, que se desprecia sistemáticamente). Pero ¿tanto?

Evidentemente, aquí hay gato encerrado. Demasiadas veces los analistas nos quedamos en el nivel de análisis que nos dice lo que buscamos, y demasiadas veces los que estudian la educación desde una perspectiva sociológica se quedan aquí y no profundizan más porque han llegado donde esperaban. Unas veces puede estar justificado, otras no. Veamos el siguiente gráfico, una versión corregida del anterior:
















Lo que hemos hecho ha sido dividir las comunidades españolas en dos, norte y sur, para ver cómo funciona el análisis. Lo que ocurre es que las CCAA del norte de España lo hacen mejor en PISA y tienen menos paro (en este caso, junto con Baleares: allí el verano sí ha funcionado, pero en el cuarto trimestre la cosa cambiará), y las del sur tienen más paro y lo hacen peor en PISA. En el círculo naranja están agrupadas las del norte de España, muy juntitas, y en ese grupo el nivel explicativo apenas supera el 20% y deja de ser significativo. Más sueltas están las del sur de España, cuya recta tiene una pendiente similar, pero su correlación es ridícula. Esto pasa con todas las variables educativas expuestas anteriormente. 

Por tanto, lo que tenemos son dos españas que explican un porcentaje muy alto de la correlación. Este fenómenos es muy habitual en las correlaciones de grupos: cuando separas varones y mujeres, escuela pública y privada, u otras tantas dualidades la supuesta relación entre variables se debilita o llega a desaparecer. En el caso analizado, si se introduce la variable norte-sur en la ecuación, la influencia de los datos de PISA se queda en la mitad y deja de ser significativa.

Por supuesto, en la diferencia entre las dos españas influye esa variable latente en la que incluimos todos los factores que citábamos antes, es algo que ya sabemos. Pero al incluirlo en una regresión podemos achacar a las comunidades lo que es un efecto que actúa a un nivel superior (y justificar con una regresión con muchos puntos lo que en realidad es básicamente una diferencia entre dos puntos, que se trata técnicamente de otra forma).

Nos encontramos otra vez con algo de lo que he hablado muy a menudo y que en el libro repito continuamente: muchas de las creencias que sostenemos en educación son fruto de análisis insuficientes, cuando no análisis de medio pelo o interesados. He visto papers íntegros basados en este fenómeno, donde se incluyen 15 o 20 regresiones de este tipo (que, como hemos visto, hablan siempre de lo mismo) y se permiten sacar conclusiones. El mismo Instituto de Evaluación cae continuamente en este tipo de análisis.

Nos queda el problema norte-sur, algo persistente en España, aunque se ha reducido mucho en las últimas décadas (eso es algo que se tiende a olvidar: aunque sigue habiendo diferencias, la magnitud de éstas no tiene nada que ver). Diferencias que no son fáciles de reducir por medio de políticas públicas (aunque sí de ampliar, que también se olvida), y que yo sepa la mejora se ha basado en una escuela fuerte (que ya no tenemos) y en la redistribución del gasto público.

Nota de disculpa: Entiendo que mucha gente no acabe de entender las regresiones (por favor, que alguien las incluya en el currículo común del Bachillerato), pero muchos de los argumentos y justificaciones que uno oye todos los días tienen a esta técnica detrás, aunque no de forma transparente. Es decir, es algo que nos afecta, lo queramos o no, en nuestra vida diaria, y es una carencia importante (y no soy el único que la nota) bastante generalizada en España, incluso entre los que tienen poder de decisión. Pero es que hay cosas que no se pueden explicar de otra forma.

José Manuel Lacasa 
ifie (Instituto F de Investigación Educativa)

No hay comentarios: