La conducción autónoma ha sido una promesa ambiciosa hecha por algunas de las principales empresas de tecnología y nuevas empresas del mundo, incluidos gigantes como Google, Tesla y Uber, sin embargo, su adopción masiva sigue fuera de su alcance.
Desde 2022, muchas empresas de vehículos autónomos (AV) han cerrado, y nombres importantes como Waymo de Google, Tesla de Elon Musk y Cruise de General Motors, a pesar de recibir miles de millones de dólares en fondos, están reduciendo sus equipos y luchando por mantener la visión del coche autónomo.
A pesar de los avances significativos en la visión por computadora, como el desarrollo de Detectron2, siguen ocurriendo accidentes que involucran AV. En octubre del año pasado, Cruise retiró sus 950 modelos autónomos para actualizar el software después de que un vehículo arrastrara a una mujer por una calle en San Francisco.
¿Qué causa estos fallos y por qué las máquinas no pueden replicar el comportamiento humano al volante?
Arturo Deza, ex investigador postdoctoral en el Instituto de Tecnología de Massachusetts y profesor de la Universidad de Ingeniería y Tecnología de Lima (UTEC), tiene la misión de averiguarlo.
Su startup, Artificio, está desarrollando una plataforma de evaluación comparativa específicamente para la conducción autónoma en condiciones difíciles. La compañía tiene su sede en Lima, que la aplicación de navegación TomTom nombró recientemente como la ciudad con peor tráfico de América Latina.
El desafío de la conducción autónoma
Según Deza, la conducción autónoma «ha fracasado debido a una promesa exagerada de que los sistemas de visión artificial ya estaban resueltos, como si la visión por computadora estuviera completamente desarrollada».
Le dijo a Peru Reports que la promesa de que una computadora puede identificar objetos comunes es un estiramiento, y que «todavía hay condiciones en las que el estímulo es ambiguo».
Si bien los compuadores pueden identificar bien la mayoría de los objetos, explicó, a menudo fallan en situaciones complicadas, como conducir en tráfico congestionado. «Muchos proyectos de automóviles autónomos han fracasado o cambiado de dirección debido a estas dificultades. Un ejemplo es Argo AI, que se declaró en quiebra a pesar de una inversión de mil millones de dólares», agregó.
Según un estudio publicado por Artificio en diciembre pasado, el fallo perceptivo de la conducción autónoma se produce debido a dos factores principales.
En primer lugar, la falta de comprensión perceptiva de los estímulos fuera de distribución. Y, en segundo lugar, la falta de puntos de referencia de alta calidad para estos escenarios fuera de distribución.
«En muchos casos, los vehículos autónomos se entrenan con datos reales o sintéticos en condiciones de sol casi perfectas o con pocas personas, con semáforos que funcionan perfectamente, carreteras bien pavimentadas, conductores respetuosos de la ley y peatones atentos», según el estudio. «Sin embargo, cuando las cosas salen mal y los vehículos deben navegar a través de la niebla, una multitud en un desfile, perros corriendo (o jugando) en la calle sin correa, o comprobando si hay scooters en los carriles laterales, la inferencia perceptiva en muchos de estos sistemas comienza a fallar», dijo.
Propuesta de Artificio: probar la conducción autónoma en condiciones extremadamente adversas
En su mente, Deza vio su propio patio trasero como un campo de pruebas ideal.
El fundador de Artificio sugiere que la industria audiovisual primero recopila más datos de los países en desarrollo, donde los patrones de conducción son diferentes y más desafiantes, como en Lima. Esto ayudaría a entrenar mejor los sistemas de visión por ordenador utilizados por los coches autónomos.
«Si un vehículo autónomo puede navegar e identificar fácilmente cada objeto y obstáculo a partir de las imágenes de video de rutas en Lima, Hanoi o Mumbai, entonces hacer inferencias perceptivas en ciudades como San Francisco, Londres y Beijing debería ser trivial», dijo Deza.
Además, Artificio propone que la capacitación de los sistemas de visión por computadora de vehículos autónomos se lleve a cabo fuera de la ciudad donde se desplegarán. En el aprendizaje automático, esto se llama entrenamiento adversario. Este método entrena a los sistemas con datos adversos y poco comunes, lo que aumenta la probabilidad de que las redes neuronales funcionen bien en situaciones esperadas e inesperadas.
Recopilación de datos en las calles peruanas
Si has visitado Lima, es posible que sepas que el área metropolitana de 11 millones de habitantes puede ser caótica para moverse. Según un reciente estudio de tráfico de TomTom, Lima lidera el ranking de ciudades de América Latina con el peor tráfico, superando a otras grandes metrópolis como Bogotá y Ciudad de México. Además, ocupa el quinto lugar en el índice de ciudades con la peor congestión de tráfico del mundo, solo superada por Milán, Toronto, Dublín y Londres.
Debido a esta realidad, entre diciembre de 2023 y marzo de 2024, Artificio recopiló datos en varias ciudades peruanas, incluidas Lima, Cusco y Cajamarca, utilizando cámaras de salpicadero y cámaras GoPro montadas en vehículos.
«La recopilación de datos es simple, pero analizar y etiquetar es un proceso más complejo y laborioso», explicó Deza. «Nuestro objetivo es hacer una comparación con datos anotados para evaluar la precisión del modelo», agregó.
El equipo de Artificio se ha enfrentado a desafíos únicos, como la identificación de vehículos poco comunes en Perú, incluidos los mototaxis y los carros de vendedores de helados, que no están incluidos en las categorías de modelos actuales.
«Este estudio nos está enseñando que necesitamos nuevas categorías de objetos para diferentes contextos geográficos, ya que las situaciones en la India, por ejemplo, serán diferentes a las del Perú», agregó Deza.
El objetivo, dijo, es encontrar principios fundamentales que se puedan generalizar a todas las ciudades. «Si logramos eso, otras empresas también se beneficiarán».
Un enfoque innovador con IA neuronal para la clasificación de objetos
A diferencia de los modelos actuales de inteligencia artificial, que dependen de grandes cantidades de datos y recursos computacionales (como GPU y terabytes de datos) para lograr la clasificación de objetos, la tecnología Neural AI desarrollada por Artificio tiene como objetivo lograr lo contrario.
Deza explicó: «Nuestra tecnología busca utilizar la menor cantidad de datos y recursos posible para crear un sistema igual o mejor que los modelos existentes, como Detectron2, YOLO o RetinaNet. Esto es crucial por varias razones, incluido el costo-beneficio y el manejo ético de los datos».
La idea detrás de los modelos fundamentales de NeuroAI patentados de la compañía, según el CEO, es que los vehículos autónomos pueden consultar cualquier objeto que vean en la carretera y encontrar el objeto más similar y ya clasificado para resolver el conflicto en tiempo real.
La visión a largo plazo de Artificio
Por supuesto, hay un largo camino por recorrer para que Artificio compita con, y posiblemente ayude, con las empresas de AV más grandes. Su siguiente paso, dijo Deza, es comercializar su plataforma, permitiendo a cualquier estudiante o ingeniero cargar y evaluar sus modelos a través de una aplicación web.
«Estamos construyendo una plataforma donde la gente puede cargar y evaluar sus modelos, incluso sin ser parte de una empresa, que democratiza el acceso a estas tecnologías avanzadas», dijo.
Además, Artificio planea incorporar sensores de detección de luz y alcance (Lidar) en los vehículos de Perú, enriqueciendo aún más su plataforma de datos y demostrando las capacidades de estos sistemas en condiciones extremas.
«Si un vehículo autónomo puede manejar en Perú, puede manejar en cualquier lugar», dijo Deza.
A pesar de sus contratiempos, prevé un futuro prometedor para la conducción autónoma, aunque reconoce que aún hay que superar muchos desafíos: «Creo que para 2030, los vehículos autónomos deberían estar operativos a nivel mundial, pero el desafío es que las empresas sobrevivan hasta entonces debido a los altos costos y la lenta adopción».
Por Diego López Marina en Peru Reports
El periodismo independiente necesita del apoyo de sus lectores para continuar y garantizar que las noticias incómodas que no quieren que leas, sigan estando a tu alcance. ¡Hoy, con tu apoyo, seguiremos trabajando arduamente por un periodismo libre de censuras!
Apoya a El Nacional