Train Report

Generación de informes PDF a partir de ficheros CSV con los datos de los acelerómetros, agrupando lógicamente los eventos de vibración detectados para determinar qué vibraciones corresponden al paso de los trenes y su posterior resumen en un fichero de reportes.

Descripción

El script train-report-smartbridges.py procesa los archivos CSV de los datos en crudo para cada uno de los sensores, agrupando los eventos de trenes detectados en función de la coincidencia temporal entre sensores.

Una vez determinadas qué vibraciones corresponden a un tren, se genera una página en un informe PDF con gráficas de aceleración por cada eje y la transformada FFT.

Para una explicación más detallada del proceso, véase

Requisitos

Python 3.7+
Librerías externas (versiones mínimas recomendadas):
- matplotlib >= 3.5
- numpy >= 1.21
- pandas >= 1.3
- seaborn >= 0.11
- scipy >= 1.7
- PyPDF2 >= 2.0

Instalación de dependencias

Para instalar las dependencias necesarias, asegúrate de tener pip instalado y ejecuta el siguiente comando:

pip install -r requirements.txt

Uso

El script se ejecuta desde la línea de comandos y requiere la ruta al directorio del puente donde se encuentran los datos de los sensores. El script buscará en la carpeta raw dentro de esa ruta los archivos CSV con los datos de aceleración.

Para ejecutar el script, utiliza el siguiente comando:

python train-report-smartbridges.py --bridge_path /ruta/al/puente

El script tiene dos modos de operación:

Generación de informes: Procesa los datos de los sensores y genera un informe PDF con las gráficas de aceleración y FFT.
Regeneración de páginas específicas: Permite regenerar páginas concretas del informe en una fecha y horas específicas.

Argumentos

El script train-report-smartbridges.py acepta los siguientes argumentos:

--bridge_path: Ruta a la carpeta del puente donde se encuentran los datos.

Parámetros opcionales:

--date (opcional) : Fecha a procesar en formato YYYYMMDD. Si no se indica, usa el día anterior al día del sistema.
--version : Muestra la versión del programa y termina la ejecución.
--min_sensors N : Número mínimo de sensores para considerar un evento (por defecto: 5)
--workers N : Número de hilos para el procesamiento paralelo (por defecto: 2 x núcleos CPU)
--regenerar-hora : Una o varias horas (formato HH:MM:SS) para regenerar páginas concretas del informe.

En la siguiente sección se detallan ejemplos de uso del script.

Ejemplos de uso

Creación de informes

Para generar el informe completo del día anterior:

python train-report-smartbridges.py --bridge_path /ruta/al/puente

Para generar el informe especificando el número de sensores mínimos y el número de hilos:

python train-report-smartbridges.py --bridge_path /ruta/al/puente --min_sensors 3 --workers 4

Para generar el informe de una fecha concreta (formato YYYYMMDD):

python train-report-smartbridges.py --bridge_path /ruta/al/puente --date 20240601

Regenerar páginas específicas

Si necesitas regenerar la página de un tren concreto (por ejemplo, el tren detectado a las 12:34:56):

python train-report-smartbridges.py --bridge_path /ruta/al/puente --date 20240601 --regenerar-hora 12:34:56

Regenear varias páginas para diferentes horas:

python train-report-smartbridges.py --bridge_path /ruta/al/puente --date 20240601 --regenerar-hora 12:34:56 13:45:00

Para regenerar alguna página para el dia anterior, simplemente no indiques la fecha:

python train-report-smartbridges.py --bridge_path /ruta/al/puente --regenerar-hora 12:34:56 13:45:00

Salida

El informe PDF se guarda en:

/ruta/al/puente/report/<año>/<mes>/<día>/train_report_<fecha>.pdf

Notas importantes

Estructura de los datos

El script espera una estructura de carpetas específica para procesar los datos:

La carpeta raíz debe contener las carpetas que representan los puentes, cada una con dos subcarpetas:
- La carpeta raw con los datos crudos de los sensores.
- La carpeta report donde se guardan los informes generados.
La carpeta raw contiene subcarpetas organizadas por año, mes (inglés en minúscula) y día, y dentro de estas, las carpetas de los sensores.
Dentro de las carpetas de los sensores, existe la carpeta anomalias que contiene archivos CSV con datos no válidos o irrelevantes, los cuales son ignorados por el script.
La carpeta report contiene subcarpetas organizadas por año, mes (inglés en minúscula) y día.

Formato de los archivos CSV

Cada archivo CSV que contiene los datos en crudo se denomina acceleration_HH-MM-SS.csv y es un archivo único separado por comas (,), con números en formato decimal con punto (.). Las columnas son:
- timestamp: Hora de la medición
- x_accel (g): Aceleración en el eje X (en g)
- y_accel (g): Aceleración en el eje Y (en g)
- z_accel (g): Aceleración en el eje Z (en g)
El timestamp sigue el formato HH:mm:ss.SSS (hours:minutes:seconds.milliseconds)

Procesamiento de eventos

El script procesa todos los archivos CSV de aceleraciones de todas las carpetas de sensores del día correspondiente.
Se crean grupos disjuntos de vibraciones por timestamp (con una diferencia máxima de 2 segundos entre sensores) para determinar qué vibraciones corresponden al paso de un tren.
Si no se encuentran suficientes sensores para un evento (por defecto, menos de 5), ese grupo se omite y no se genera una página en el informe.

Funcionamiento y salida

Se generan gráficas de aceleración y transformadas FFT para cada eje (X, Y, Z) de cada tren detectado.
El PDF generado se guarda en la carpeta report del puente, organizada por año, mes y día. Cada página del informe corresponde a un tren detectado e incluye: - Número de tren, fecha y hora. - Gráficas de aceleración en los ejes X, Y y Z. - Transformada FFT para cada eje.
Los archivos PDF generados se nombran con el formato train_report_<fecha>.pdf, donde <fecha> es la fecha del informe en formato YYYYMMDD.

Cuestiones técnicas

El script utiliza mutithreading para procesar cada carpeta de puente.
El script está pensando para ser gestionado por un servicio de systemd que se active diariamente y automáticamente para generar informes diarios.
El cálculo de la transformada FFT se realiza utilizando la función scipy.fftpack.fft para cada eje de aceleración que internamente utiliza multiprocessing.
Se ha aplicado un multiprocessing extra para calcular la FFT por cada sensor.