La aplicación de la ciencia de datos y el aprendizaje automático a la ingeniería del transporte es esencial para abordar los desafíos modernos de la movilidad urbana. Esta tesis investiga si estas tecnologías mejoran la toma de decisiones en los sistemas de movilidad, con el objetivo de crear soluciones más eficientes, sostenibles y cohesionadas. Al aprovechar estas herramientas, la investigación introduce innovaciones en diversas aplicaciones de movilidad urbana para apoyar a organizaciones, partes interesadas y responsables políticos en la gestión de la movilidad urbana.
La metodología incluye comprensión del dominio, recopilación, limpieza y exploración de datos, ingeniería de características, modelado predictivo y comunicación con partes interesadas. En su núcleo está un compendio de cuatro publicaciones científicas, cada una aportando evidencia empírica y conocimientos alineados con los objetivos generales.

Los objetivos específicos son: (i) identificar fuentes de datos y técnicas de recopilación efectivas para el análisis de movilidad urbana; (ii) determinar el papel de la ingeniería de características en la mejora de la calidad y relevancia de los datos; (iii) evaluar la idoneidad y el valor añadido de las técnicas de aprendizaje automático en desafíos de movilidad urbana; y (iv) analizar el rendimiento de los modelos y definir recomendaciones de políticas para las partes interesadas de la movilidad.
Estos objetivos se prueban a través de tres aplicaciones prácticas: (i) promover la micromovilidad para compras urbanas; (ii) establecer precios en servicios de vehículo de transporte con conductor (VTC); y (iii) predecir la demanda de motos compartidas.
La primera aplicación examina los factores que influyen en la adopción de bicicletas y patinetes (principalmente modos activos) para compras urbanas en ciudades con baja madurez en micromovilidad. Usando modelos de aprendizaje automático aplicados a datos de encuestas, se identifican barreras y se proponen recomendaciones para mejorar infraestructura y seguridad, destacando su potencial de crecimiento post-COVID-19.
La segunda aplicación explora la dinámica de precios en servicios de VTC. Un estudio analiza patrones tarifarios antes y durante la pandemia en Boston y Atlanta, identificando la dinámica de tarifas en tiempos de crisis. Otro examina los determinantes de tarifas en Madrid, considerando clima y horarios pico. Estos estudios ofrecen estrategias de precios y recomendaciones de regulación para integrar mejor los servicios VTC.
La tercera aplicación se centra en predecir la demanda de motos compartidas. Usando técnicas de aprendizaje automático, se predice la demanda basándose en datos sociodemográficos, atributos de la red y variables políticas. Los resultados destacan la efectividad del modelo de random forest y la importancia de las características de los barrios y las preferencias por trayectos de corta distancia en la planificación urbana y gestión del transporte.
Esta tesis demuestra que la ciencia de datos y el aprendizaje automático mejoran la toma de decisiones en sistemas de movilidad al incrementar la precisión de predicciones, optimizar el uso de datos y ofrecer recomendaciones prácticas para la movilidad sostenible. También reconoce desafíos como la necesidad de datos de alta calidad, algoritmos robustos y modelos más interpretables. Abordar estas limitaciones es clave para garantizar implementaciones exitosas y maximizar el impacto de estas tecnologías.


APPLYING DATA SCIENCE AND MACHINE LEARNING TO TRANSPORTATION ENGINEERING: DOES IT IMPROVE DECISION-MAKING IN MOBILITY SYSTEMS?
Autor: Túlio Silveira Santos.
Directores: José Manuel Vassallo Magro y Thais Rangel Guilherme Christiano.
Lugar y Fecha: Universidad Politécnica de Madrid, Escuela Técnica Superior de Ingenieros de Caminos, Canales y Puertos. 8 de abril de 2025.