Universidad Politécnica de Madrid Universidad Politécnica de Madrid

Escuela Técnica Superior de Ingenieros
en Topografía, Geodesia y Cartografía

RoadMark-cGAN (artículo de investigación)

Nuevo modelo generativo condicional para el cartografiado de líneas de marcado vial

02/02/2026

Título: RoadMark-cGAN: nuevo modelo generativo condicional para el cartografiado de líneas de marcado vial

Subtítulo: Esta investigación, liderada por el profesor Ionut Cira, constituye un avance significativo en la aplicación de redes generativas condicionales para la extracción automática de elementos geoespaciales. El trabajo se ha desarrollado durante una estancia de cinco meses en la Universidad de Tokio (Japón) y en estrecha colaboración con el equipo de Geoinformática del RIKEN Center for Advanced Intelligence Project (AIP), dirigido por el profesor Naoto Yokoya. En el proyecto también han participado los profesores Miguel Ángel Manso y Ramón Alcarria, junto con el Director de la E.T.S. de Ingeniería de Sistemas Informáticos, el profesor Borja Bordel.

 

El modelo RoadMark-cGAN propone una arquitectura novedosa del generador que integra bloques residuales y de atención en un cuello de botella funcional. Por su parte, el discriminador incorpora un codificador optimizado, un bloque de atención adicional y un mecanismo de decaimiento exponencial durante el entrenamiento. El bloque de atención se basa en una capa convolucional 1×1 con relleno y normalización espectral, lo que permite reducir la dimensionalidad de las características y generar mapas de atención.

 

Figura 1. Simplificación del procedimiento de entrenamiento de RoadMark-cGAN.

Figura 1. Simplificación del procedimiento de entrenamiento de RoadMark-cGAN.

 

 

  La versión RoadMark-cGAN-v2 introduce un sistema avanzado de regularización mediante dropout dinámico, en el que la tasa de apagado varía según la época de entrenamiento. Este enfoque mejora la capacidad de generalización: una tasa más alta en las primeras etapas promueve la exploración de un rango más amplio de características, mientras que una tasa más baja en las etapas finales permite refinar la extracción de clases minoritarias, como la clase “Marca_vial”.

La versión RoadMark-cGAN-v3 incorpora una nueva función de pérdida denominada Morphological Boundary-Sensitive Class-Balanced (MBSCB), que combina componentes morfológicos (centrados en considerar la propiedad de delgadez morfológica inherente al objeto extraído), Dice (para optimizar la superposición entre los segmentos predichos y los segmentos reales), adversarios y L1 (aplicada a los logits de salida sin procesar del generador). Esta función equilibra la atención al contraste entre clases poco representadas, la delgadez morfológica de las marcas viales y la coherencia espacial entre segmentos reales y predichos.

Finalmente, RoadMark-cGAN-v4 fusiona las innovaciones introducidas en las versiones v2 (dropout dinámico) y v3 (función de pérdida MBSCB), logrando un rendimiento superior a los mejores modelos actuales de segmentación semántica. Esta versión alcanzó un valor IoU de 0,473 para la clase positiva y una mejora del 1,7 % respecto al estado del arte, junto con una puntuación F1 de 0,642, que confirma su idoneidad para tareas de mapeo vial automatizado.

 

Figura 2. Muestras de predicciones sobre datos no vistos obtenidos con los mejores modelos entrenados.

 

 Esta investigación señala el gran potencial del aprendizaje generativo condicional para la extracción de elementos geoespaciales, consolidando el papel de la GeoIA y la visión artificial en la producción cartográfica a partir de imágenes de teledetección.

El artículo completo se puede encontrar en el enlace: https://www.mdpi.com/2079-9292/15/1/224