EPISODIOS DE OZONO EN PUERTOLLANO

Puertollano es un municipio de Ciudad Real, Castilla-La Mancha, ubicado en la comarca del Campo de Calatrava que cuenta con una población de 46.128 habitantes (según el censo de 2021 del INE). La población presenta una tradición industrial marcada en un principio por la explotación del carbón y, posteriormente, por la creación del complejo petroquímico de Puertollano, surgido inicialmente para obtener petróleo mediante destilación de las pizarras bituminosas, en 1942.

En materia de calidad del aire el municipio tiene interés por la especial configuración orográfica del mismo y por la presencia de un importante polo industrial que hace que el comportamiento de los parámetros de calidad del aire difieran en ocasiones de lo que nos podríamos encontrar en otras ubicaciones, tanto de Castilla-La Mancha como del resto del territorio nacional.

El Ozono (O3) es precisamente uno de esos contaminantes que en el caso de Puertollano presenta un comportamiento distinto al habitual y del que, hasta el momento, no consta que se hayan realizado estudios en profundidad sobre episodios de contaminación o atribuciones de fuentes. Por ese mismo motivo me lancé a solicitar los datos a la Red de Calidad del Aire de Castilla-La Mancha y ponerme manos a la obra. Veamos pues cómo son los episodios de Ozono en Puertollano y de donde vienen esos picos de contaminación.


PREPARANDO LOS ARCHIVOS

La Red de Calidad del Aire de Castilla La Mancha dispone de un repositorio de datos muy interesante en su página web y, además, a través de su sistema de consultas públicas, permite solicitar los archivos de datos completos de estaciones y contaminantes en formato de texto plano que son mucho más amigables para su uso.

En nuestro caso solicitamos datos validos (V) para los contaminantes y la meteorología de la estación de Campo de Futbol, una de las más representativas para estudiar los datos de ozono en Puertollano, y desde luego una de las que quedan con un histórico de datos adecuado para realizar estudios de evolución, tras los últimos cambios de ubicación de estaciones que se han llevado a cabo en Puertollano, que rompen con el histórico de datos acumulado hasta el momento en otras ubicaciones, impidiéndonos hacer análisis temporales y espaciales más concienzudos.

Los datos se mandan en archivos de texto plano sobre los que ya se ha trabajado para su filtrado, remitiendo solo datos válidos y sin flag, por lo que tan solo queda convertir la fechas a UTC dado que el 22 de octubre de 2022 la red cambió el sistema de trabajo pasando de horario local a UTC. Se hace un trabajo también de filtrado posterior para eliminar outliers, si bien es cierto que los datos se muestran bastante correctos y solo hay que eliminar algunos outliers en datos validados meteorológicos que no son coherentes, y de forma muy puntual. La detección y eliminación de outliers se lleva a cabo aplicando el test de Tukey y eliminando los valores atípicos extremos.

Definidas y convertidas las fechas hemos utilizado los datos de la estación de Almacén para suplir los huecos que tenemos de datos de meteorología de Campo de Futbol en algunos periodos, especialmente para el caso de la Radiación Solar, vital para determinar el comportamiento del ozono pero que en esta estación presenta rendimientos de captura de datos inferiores al 50% en algunos ejercicios.

Lo primero que nos percatamos en este sentido (ver gráfico), es que los datos de radiación solar en la zona son escasos, y que como mucho nos van a permitir estudiar el ozono entre los años 2016-2017 (para el periodo prepandemico) y los años 2022-2023 (para el periodo postpandemico), quedando el resto de años “ciegos” a la definición de episodios de ozono por no haber datos meteorológicos adecuados.

Si bien sería interesante tener más datos, es posible considerar que con cuatro años se pueden definir bien los escenarios que generan las superaciones de ozono en la zona.


LA PANDEMIA COMO INDICADOR DE ESCENARIO ATÍPICO.

Antes de la pandemia la evolución general del ozono en España era a presentar una tendencia descendente en los valores máximos y ascendente en los mínimos, lo que supone un incremento de la exposición crónica y un descenso en las exposiciones episódicas agudas, existiendo excepciones a esta regla general como son el caso de Madrid, que presentaba incremento en todos los ámbitos, o del propio Puertollano, que no presentaba una tendencia clara. (Massague et al, 2023)

Durante la pandemia las condiciones de restricción de tráfico y actividades industriales no esenciales dieron lugar a una evolución en las concentraciones de contaminantes que se vieron contrapuestas, con un descenso marcado del NO2 que podría ir en toda Europa entre el -34% de media en zonas urbanas al -32% en zonas rurales y un incremento generalizado del O3 que podría estar entre el +30% en zonas urbanas y el +21% en zonas rurales, lo que sugiere que el oxidante total (Ox) quedó prácticamente inalterado y que conseguir reducciones de ozono sustanciales requiere de acciones de mitigación adicionales (Grange, S.K et al, 2021).

La estación de Campo de Futbol durante la pandemia, si bien respondía a este mismo patrón de acontecimientos, experimentó una evolución algo distinta al resto de estaciones de la región en latitudes semejantes, tal y como se observa en la siguiente gráfica, donde se puede comprobar que los contaminantes primarios presentan un descenso algo menor, con un descenso del -56% del NO2, frente al descenso experimentado por Ciudad Real o Albacete, del 64% y el 65% respectivamente.

Este descenso en el NO2, al igual que en el resto de estaciones va acompañado de un aumento del ozono, tal y como se reseñaba anteriormente, pero al igual que antes, este incremento en el ozono vuelve a ser levemente distinto en el caso de Puertollano, que sube un +57%, mientras que en casos como Ciudad Real y Albacete asciende un 94% y un 97% respectivamente, marcando un diferencial de comportamiento aún más relevante.

Resulta evidente, a la vista de la evolución experimentada, que Puertollano tiene una configuración muy distinta respecto al resto de zonas tanto en el perfil de emisiones de contaminantes primarios como en la configuración del área en la que se producen dichas emisiones y que terminan generando una evolución distinta del ozono.

Este hecho se pone de manifiesto, si estudiamos la distribución temporal horaria de los valores alcanzados por el ozono y los contaminantes primarios principales en los días con superación del nivel establecido por las directrices sobre calidad del aire para el ozono establecido por la Organización Mundial de la Salud (OMS) de 100 µg/m3 en el valor máximo octohorario diario o en el la superación del umbral de información horario (180 µg/m3 como valor máximo horario).

Así, podremos observar que la estación de Campo de Futbol en Puertollano experimenta en muchas ocasiones valores elevados de ozono cuando el resto de estaciones de la misma latitud no lo hacen, o no al nivel de la estación de Campo de Fútbol, expresando una contribución importante de las condiciones meteorológicas y de emisión de precursores locales (gráfico A).

De hecho, incluso cuando las condiciones regionales son proclives a presentar valores elevados de ozono el perfil de variación horaria de este parámetro para la estación de Campo de Futbol (Gráfico B) es distinto al observado en el resto de la región, pudiendo verse un máximo previo, a última hora de la mañana, mucho antes de los máximos habituales a mitad de tarde.

Todo lo visto apunta a que en Puertollano se dan unas condiciones peculiares de emisión y de dispersión de contaminantes que generan una afección por ozono particular, con un marcado componente local, que es interesante analizar de forma detallada, para lo cual se propone el procedimiento que se comenta en próximos apartados.

Puertollano presenta unas condiciones particulares de emisión y dispersión de contaminantes que le llevan a presentar una afección por Ozono muy peculiar, tanto en las concentraciones alcanzadas como en la distribución horaria de las mismas.

ESCENARIOS DE OZONO Y SU DISTRIBUCIÓN TEMPORAL

Dado que nuestra referencia para la definición del día con superación va a ser el valor de referencia de la OMS para la protección de la salud (100 µg/m3 en el dato octohorario), deberemos calcular la media móvil octohoraria para el ozono de nuestro conjunto de datos.

Tanto para dicha media móvil octohoraria como para la media horaria, calcularemos además el diferencial que se obtiene en los datos horarios de superación cada vez que se supera el valor de referencia octohorario o el umbral de información horario (180 µg/m3), al objeto de poder comprobar cuál es la amplitud de dicha superación.

Al hacer esto podremos seleccionar los días con superación de los niveles de ozono y observar que antes de la pandemia (años 2016 – 2019) se dieron un mayor número de días de superación, con 264 días (un 18%) frente a los observados tras la pandemia (2020 – 2023) con un total de 243 días (un 16,6%). Esta reducción en el número de días con episodio, sin embargo, no se corresponde con la intensidad de las superaciones, pudiendo observarse que tras la pandemia el ozono experimentó un incremento en el número de horas al día que se supera el valor objetivo así como en el nivel de superación.

Este incremento en la intensidad sin embargo no se produce sobre los máximos, y de hecho se observa una disminución en el número de días episódicos en los que se supera también el umbral de información a la población por ozono (180 µg/m3 en una hora), pasando de un 10,6% de los días con superación, previamente a la pandemia, a los 8,2% de los días tras la pandemia.

Estos últimos datos sobre la amplitud, no obstante, deben observarse teniendo en consideración que tras la pandemia los datos presentan una distribución irregular, concentrándose la mayor parte de las superaciones en el año 2023, donde se muestra un incremento inusual que hay que considerar con precaución, tal y como se observa en las siguiente gráficas, pudiendo deberse a un problema con el analizador.

De hecho, si realizamos un zoom sobre los datos de ozono del año 2023 podemos observar como el equipo presenta una deriva al alza en los datos tras una serie de “huecos de datos” (datos anulados o no válidos) en el mes de Enero de 2023, huecos que se suelen corresponder con trabajos de mantenimiento que, a tenor de la extensión, debieron de ser problemáticos. Es por lo tanto posible que las concentraciones de fondo medidas por el equipo se hayan visto sobre elevadas algo más de 20 µg/m3, lo cual justificaría en parte el incremento de los valores base de ozono y de los días con superación.

Los datos pues nos obligan a descartar, para evitar introducir ruido en nuestros cálculos, los datos de ozono del año 2023, que presentan días con superación del valor de referencia casi en todos los meses del año, a excepción de enero y diciembre. Nos quedarán pues los años 2016, 2017 y 2022 para definir los episodios de ozono en Puertollano atendiendo a nuestro conjunto de datos.


DEFINIENDO LOS PARÁMETROS DE SUPERACIÓN DE OZONO.

Localizados los días con superación del valor octohorario de ozono establecido como referencia para definir las superaciones, y marcado también el periodo más representativo donde se producen dichos episodios cada año para eliminar factores estacionales, procedemos a extraer dos conjuntos de datos para los años de referencia:

  1. Un primer conjunto de datos horarios con los días con superación del valor de referencia de la OMS.
  2. Un segundo conjunto de datos horarios, para los días dentro del periodo de fechas indicado, en el que se producen las menores concentraciones de ozono escogiendo el percentil de datos correspondiente de cada año que permite tener la misma extensión que el conjunto de datos primero.

El resultado será el siguiente:

De esta forma tendremos dos conjuntos de datos horarios de contaminantes y meteorología, con la misma extensión de días (183 días cada uno) pero que representan dos situaciones extremas dentro de un mismo periodo de tiempo. Situaciones en las que se produce un episodio de ozono, y situaciones en las que la media de ozono es la menor posible dentro del periodo en estudio.

Al contrastar ambos conjuntos de datos, podremos observar qué es lo que caracteriza de forma general los episodios de ozono en Puertollano, tal y como se puede ver en el siguiente gráfico, y qué factores son los que determinan su aparición en mayor o menor medida, permitiéndonos fijar los estadísticos que necesitaremos posteriormente para profundizar en el estudio.

Al observar la gráfica anterior podremos alcanzar las siguientes conclusiones básicas:

  • Ambos escenarios han quedado debidamente caracterizados y diferenciados, ya que las concentraciones de ozono en la práctica ni se tocan. En este sentido, la distribución temporal del ozono es similar a lo largo del día, lo que implica condiciones estables siempre en la generación de este contaminante a lo largo del día, si bien es cierto que los días con superación el máximo de ozono de por la mañana parece más exacerbado.
  • El factor meteorológico, como cabe esperar, apunta a ser esencial en la aparición de episodios de ozono, quedando especialmente definidos y diferenciados los parámetros de radiación solar, temperatura y humedad relativa para todo el periodo diario.
  • También se observa que la dirección del viento y su evolución a primera hora del día es importante a la hora de definir un episodio, incluso más que la propia velocidad del viento, si bien es cierto que parece que los episodios tienen tendencia a estar dominados por las situaciones de estabilidad atmosférica y un menor movimiento de las masas de aire en buena parte de los casos.
  • Los contaminantes primarios y precursores no están tan definidos, pero aun así también se pueden extraer algunas conclusiones clave para el estudio de los episodios. La primera de ellas, que existe un aporte industrial a considerar, elevándose aportes de contaminantes como el sulfhídrico por encima de lo habitual. La segunda de ellas es que se observan también incrementos de los precursores como el NO2 a primera hora de la mañana que se apoyan un poco después en emisiones de volátiles que podrían ser esenciales en la generación de la superación.

Se debe considerar que la gráfica anterior no es más que el resultado de un escenario promedio de superación contra un escenario de bajos niveles. Un escenario promedio que si bien puede dar una idea general de la situación en la que se producen las superaciones, es más que probable que incorpore en su formulación final distintos tipos de escenarios que se deben considerar y que habrá que estudiar en detalle con posterioridad, para lo cual se propone la técnica de clusterización que se detalla más adelante.

Para ello es preciso que establezcamos los estadísticos que nos ayudarán a definir los escenarios diarios, para lo cual se proponen los siguientes estadísticos básicos, en base a la observación de la evolución de las concentraciones horarias entre escenarios.

Con los mencionados datos estadísticos se elaborarán dos conjuntos de datos con 183 escenarios cada uno. En este ejercicio se debe destacar que la falta de un número suficiente de datos obliga a descartar el parámetro de benceno en ambos conjuntos, ya que el número de datos nulos superaba el 85% de los casos, no siendo pues representativo.

Los conjuntos de datos también deben ser filtrados para eliminar casos incompletos, con datos no disponibles en alguna de sus variables. Este filtrado termina por dejarnos un conjunto de escenarios de superación con 178 casos, y otro de escenarios de bajo ozono con 181 casos, si bien se pude considerar que seguimos teniendo un número adecuado de casos para el estudio, siendo dos muestras representativas y comparables entre sí.

A estos conjuntos de datos les vamos a aplicar una técnica de Machine Learning denominada clústering que es una técnica no supervisada que permite encontrar patrones o grupos similares (clusters) entre una serie de casos en un conjunto de datos. De esta forma el conjunto de datos se divide en una serie de particiones agrupando en su interior aquellas observaciones que son más similares entre sí y distintas al resto de grupos.

La técnica empleada será un partitioning clustering que requiere de la determinación del número óptimo de divisiones por parte del operador, haciendo uso de la distancia de Manhattan y del método K-medoids, que permitirá tener un resultado más robusto y menos afectado por outliers. No obstante, antes de realizar cualquier operación, el conjunto de datos deberá escalarse, para que la magnitud de las variables, muy distinta en el conjunto de nuestros datos, no afecte a los resultados obtenidos en la clusterización.

Para la determinación del número de clusters (K) que se considera más adecuado para cada conjunto de datos se utiliza el método elbow o método del codo, que consiste en aplicar el algoritmo k-means, para un rango de valores de K, que nosotros establecemos entre 0 y 15, para ver cómo se reduce la varianza entre el número de clústers, considerando como adecuado el punto en el que la diferencia deja de ser sustancial.

En nuestro caso, y atendiendo a la técnica anterior, consideraremos que el óptimo de clústers será de 5 para el conjunto de casos de superación, y de 4 para el conjunto de casos con valores reducidos de ozono, siendo estas las variables “k” que usaremos para el cálculo de los elementos centrales del clúster.

El algoritmo usado para el cálculo final de los clúster será el algoritmo PAM (partitioning around medoids), de la librería “cluster” de R, que correremos con la clásica semilla set.seed=(123), pasando con posterioridad a asignar los clúster obtenidos a nuestro conjunto de observaciones y a proceder a estudiar los promedios obtenidos para las observaciones de cada clúster, resultado el cuadro siguiente de clústers.

Resulta relevante, para obtener conclusiones coherentes respecto al cuadro anterior, ser conocedor igualmente de las condiciones orográficas y de distribución de la población y las actividades de la zona de estudio, tal y como se expone en el siguiente plano a escala de la zona.

Solo con observar el cuadro ya podemos ver que la superaciones de ozono se corresponden por lo general, tal y como habíamos predicho, con condiciones meteorológicas de alta radiación solar, alta temperatura y baja humedad relativa.

De hecho, el escenario principal (clúster 3), con 53 casos (30% de las superaciones en estudio), parece tener una correspondencia directa con este tipo de escenarios, presentando los valores más elevados de ozono, radiación solar y temperatura, con una humedad también mínima respecto a los registros medios observados. Este escenario de alto ozono se corresponde además con el movimiento de masas de aire desde el Oeste – Suroeste, zona interior peninsular.

Se observa también un escenario muy marcado (clúster 2) de acumulación de contaminantes primarios que termina por generar una superación de ozono, representando un 20% de las superaciones en estudio, sin que precise para ello de condiciones meteorológicas especialmente extremas en cuanto a temperatura, radiación solar y humedad. Este escenario se caracteriza por presentar las velocidades de viento más bajas de todas, con un régimen de vientos propio de la orografía de la zona que termina empujando los contaminantes primarios sobre la población y generando el episodio de ozono en cuanto se da un mínimo de condiciones adecuadas de radiación solar, temperatura y humedad. La composición de los contaminantes primarios, con presencia elevada de SO2 y H2S empuja a pensar que los contaminantes registrados son mayoritariamente de tipo industrial.

Al observar el cuadro con la definición de los clúster y comprobar la orografía y distribución de núcleos urbanos y actividades podemos ver también un tercer escenario muy específico (clúster 1), que supone el 8% de las superaciones, en el que una velocidad constante desde primera hora, procedente del Este-Sureste, traslada una masa de ozono desde un área próxima generando la correspondiente superación.

La ausencia de contaminantes primarios reseñables en el escenario, donde se detectan los mínimos, hace suponer que el ozono es alóctono y que la masa de aire desplaza los contaminantes primarios existentes en el área. Es lógico no obstante pensar que en estos escenarios el ozono entrante provendrá de acumulaciones en áreas próximas, en la dirección marcada, debidas a embolsamientos de contaminantes primaros en jornadas anteriores que, tras reaccionar y generar el ozono, han terminado por desplazarse en dirección a la población. Destacar que en esta dirección, la única actividad susceptible de generar la emisión de estos contaminantes primarios y generar estos niveles de ozono sería el complejo petroquímico de Puertollano.

Los Clúster 4 y 5, que suman en total el 45% de las situaciones de superación, comparten un perfil muy similar de direcciones y velocidades de viento, provenientes de la zona Este y Sureste del valle, en dirección también al complejo petroquímico, aunque en esta ocasión con velocidades mucho más bajas y una deriva importante al Sur en la segunda variante calculada del viento. Ambos clúster difieren de forma evidente en la composición de los contaminantes primarios, por lo que dan a entender que el origen de la contaminación primaria que termina generando el episodio, si bien proviene de una misma ubicación, tendría origen en procesos de emisión distintos. La alta composición en componentes como SO2 o H2S haría suponer no obstante un origen fundamentalmente industrial.

Estos episodios se caracterizan por generarse en momentos de radiación solar elevada, por encima de los 800 W/m2 de media en las horas de insolación, con direcciones de viento que se mantienen desde el principio en la componente Este – Sureste.


CONCLUSIONES.

Mediante técnicas de clusterización con k-medoids podemos establecer escenarios de superación fiables que nos sirven para definir las circunstancias que se dan en una determinada zona para superar un determinado contaminante, en este caso el ozono en la zona de Puertollano (estación de Campo de Fútbol).

Una buena integridad de datos es esencial para disponer de un buen conjunto de datos que poder estudiar. Los cambios de ubicación, la falta de datos de meteorología para una determinada estación, los malos mantenimientos que causan cortes prolongados en los datos de determinados equipos, así como la costumbre de realizar operaciones de mantenimiento cuando un equipo está registrando una superación, son enemigos de una minería de datos que permita hacer una descripción adecuada de una ubicación concreta, como de hecho ha ocurrido en el caso que nos ocupa.

El escenario más habitual en Puertollano, con un 30% de las ocasiones, es el generado por altos niveles de fondo de ozono y movimientos de masas regionales de este contaminante que trasladan ozono desde la zona Suroeste de Andalucía a la zona de Ciudad Real, no existiendo relación con precursores o reacciones locales, siendo este el escenario más habitual.

El otro 70% de las superaciones de ozono en Puertollano tienen un componente local relevante, por lo que se desprende que se podría actuar sobre los mismos para evitarlos o reducir su impacto en la mayoría de los casos.

El escenario más relevante es el de traslado directo de contaminantes desde distintas áreas o procesos emisores del complejo petroquímico de Puertollano, que suponen un total del 45% de los episodios, siendo estos los que presentarían un mayor potencial de evitación al no observarse fenómenos de acumulación relevantes. Estos episodios se dan habitualmente con viento del Este y Sureste y radiaciones medias durante las horas de insolación superiores a los 800 W/m2.

La composición de los contaminantes primarios registrados y las componentes del viento vistas, ponen de manifiesto que la principal fuente de emisión de precursores de ozono en la zona es la industrial, y más concretamente la asociada al complejo petroquímico de Puertollano.

Se producen también fenómenos de inversión térmica y/o acumulación de contaminantes en la zona, ya sea sobre la propia ubicación de la estación o en el área correspondiente al complejo petroquímico, que pueden terminar generando una superación de ozono, ya sea por ausencia de dispersión de los contaminantes y la generación de ozono autóctono (20% de los episodios) o por el traslado de masas de aire cargadas por ozono alóctono, generado en las proximidades del complejo petroquímico (8% de los episodios).


De nuevo mis agradecimientos a Joaquín Amat por sus increíbles recursos en materia de Data Minning y Ciencia de Datos, inspiradores de este tipo de artículos.

Comentarios

Entradas populares de este blog

TRÁFICO Y CALIDAD DEL AIRE EN MADRID

PILDORA R-1. CALIDAD DEL AIRE CON R.