Una combinación perfecta de aprendizaje automático y grandes datos para proteger los vehículos

A medida que nuestros coches se interconectan cada vez más, la movilidad adquiere un nuevo significado, ofreciendo nuevas oportunidades. La integración de las nuevas tecnologías de comunicación en los vehículos ha generado una enorme variedad de datos de diversas fuentes de comunicación.

La combinación de Big Data y los avances que se están realizando en la inteligencia artificial (IA) nos está permitiendo manejar datos de todo tipo y de diferentes fuentes, a la vez que simplifica enormemente el análisis en tiempo real.

Por lo tanto, la convergencia de la IA y los Grandes Datos juega un papel vital en todas las industrias, incluida la automotriz.

El negocio de automoción de GMV incluye el desarrollo de nuevas tecnologías para el vehículo, incluyendo la ciberseguridad, un tema al que todo el mundo se ha sensibilizado mucho en los últimos años.


Recomendado: ¿Qué es el Big data?.


En GMV llevamos años estudiando nuevas técnicas de protección de seguridad para las comunicaciones internas y externas de los vehículos.

Combinando nuestra experiencia en Machine Learning y Big Data, GMV ha desarrollado un Sistema de Detección y Prevención de Intrusiones (IDPS) basado en algoritmos que se entrenan mediante técnicas de aprendizaje de máquina para hacer la detección de intrusiones y anomalías (ataques maliciosos) mucho más efectiva y precisa.

La arquitectura general de nuestro IDPS está compuesta por varios componentes:

  • Una unidad de control telemático (TCU) que recoge los datos del coche (CAN, Ethernet, datos USB, etc…) y realiza un primer filtro básico antes de enviar los datos a un servidor. Dentro de la TCU, por lo tanto, se aplicarían reglas simples, con una carga de procesamiento muy baja, y por lo tanto fácilmente integrable en cualquiera de las unidades electrónicas del vehículo.
  • La parte complementaria del IDPS es un servidor externo que recibe los datos filtrados antes mencionados y luego utiliza algoritmos inteligentes para detectar y clasificar las anomalías/intrusiones, marcando las alertas según sea necesario. El sistema de procesamiento en nube permite reducir la carga de procesamiento en el vehículo, lo que a su vez significa que se pueden utilizar métodos de detección de intrusiones mucho más complejos para cualquier caso que implique un aprendizaje profundo.

Nuestro diseño de algoritmos de detección se puede dividir en dos fases principales: entrenamiento y detección de anomalías.

En la fase de entrenamiento offline se procesan los paquetes de datos (paquetes de datos CAN, paquetes Ethernet, datos USB) para extraer un rasgo característico que represente el comportamiento estadístico de la red.

El etiquetado de cada paquete de entrenamiento depende en gran medida de los algoritmos de aprendizaje automático que se utilicen. Un ejemplo sencillo sería el aprendizaje supervisado: cada paquete de capacitación tiene su etiqueta binaria, es decir, un paquete normal o un paquete anormal o malicioso.

A partir de los datos de entrenamiento, el algoritmo aprende a asignar la etiqueta de salida para adecuarse a un nuevo valor, es decir, para predecir el valor de salida.

Cuando se utilizan algoritmos no supervisados, no hay datos de entrenamiento etiquetados para continuar. Por lo tanto, el algoritmo crea una serie de estructuras de datos que pueden ser catalogadas en términos de semejanza y correlaciones, determinando así patrones y procesos complejos que servirán para identificar y clasificar cualquier comportamiento anómalo que pueda resultar en un incidente de intrusión.

Nuestra solución interna combina varios algoritmos de aprendizaje de máquina para poder afinar el procedimiento de detección de intrusos.

La eficiencia y precisión del modelo propuesto se evalúa y valida utilizando casos y datos reales. De nuestra propia experiencia hemos aprendido que el uso de algoritmos de aprendizaje automático asegura una rápida (hasta milisegundos) convergencia en la detección de anomalías, con una alta tasa de éxito y eficiencia.

Para complementar la detección de intrusos existe la posibilidad de aplicar metodologías de prevención; precisamente por eso la solución completa se denomina Sistema de Detección y Prevención de Intrusos (IDPS).

La forma en que se introduce la prevención en el sistema difiere enormemente según el propósito del IDPS y la forma en que puede afectar a la seguridad de los vehículos y los conductores.

Normalmente, las tareas de prevención se desglosan en acciones activas y pasivas.

Las acciones pasivas consisten en una notificación de sospecha de intrusión. Una vez que el IDPS detecta una intrusión, se envía al usuario una notificación telemática y la advertencia, que contiene todos los detalles de la intrusión, se registra en una base de datos interna.

Las acciones activas implican una serie de medidas para proteger el vehículo o mitigar la amenaza a la que está expuesto. Dependiendo de la criticidad del ataque, éste puede ser en tiempo real y puede tener un gran efecto en el sistema infectado.

En GMV estamos convencidos de que las medidas a tomar en respuesta a cualquier sospecha de intrusión son cruciales porque pueden afectar a la seguridad del vehículo: tomemos el ejemplo de un simple bloqueo del mensaje CAN del sistema de frenado, que podría tener consecuencias fatales.

Por esta razón, estamos trabajando en la mejor solución de seguridad sin perder nunca de vista los aspectos de seguridad.

Para poder afinar estos modelos es importante poder trabajar con una base de datos completa y actualizada para el entrenamiento y la mejora de los algoritmos. La colaboración con los fabricantes de equipos originales y los proveedores de primer nivel es muy importante también, en la búsqueda de estos objetivos, para asegurar que se les ofrezca la solución que mejor se adapte a sus necesidades. Por lo tanto, siempre trabajamos estrechamente con ellos en el desarrollo de soluciones de este tipo.

Autor:

Marco Donadio es Ingeniero Electrónico con un Master en Telecomunicaciones y ciberseguridad.

Se incorporó a GMV en 2008, desde el principio estuvo involucrado en varios proyectos relacionados con el vehículo conectado y autónomo. Su trabajo actual se centra en la ciberseguridad en el vehículo, y es miembro del grupo de trabajo español para la norma de ciberseguridad ISO-21434.

Publicado en Telematics Wire