Nuevo modelo de IA codificado por física para aprender dinámicas espaciotemporales

Esquema.

La Universidad de la Academia de Ciencias de China (UCAS), en colaboración con la Universidad Renmin de China y el Instituto de Tecnología de Massachusetts (MIT), ha propuesto una red novedosa neuronal convolucional recurrente codificada en física (PeRCNN), para el modelado y descubrimiento de sistemas dinámicos espaciotemporales no lineales basados ​​en datos escasos y ruidosos.

Curva de propagación de errores de la predicción y las instantáneas extrapoladas de cada modelo basado en datos en comparación con la solución de referencia.

El enfoque se puede aplicar a una variedad de problemas, como los procesos de reacción-difusión y otros sistemas de ecuaciones diferenciales parciales (PDE), incluido el análisis directo e inverso, el modelado basado en datos y el descubrimiento de PDE. El conocimiento físico previo se codifica a la fuerza, lo que le da a la red interpretabilidad.

En particular, los investigadores propusieron un marco de aprendizaje profundo que codifica por la fuerza una estructura física determinada en una red neuronal convolucional recurrente para facilitar el aprendizaje de la dinámica espaciotemporal en regímenes de datos dispersos.

Descubrieron que dicho paradigma computacional exhibe alta precisión, solidez, interpretabilidad y generalización, y demostraron las capacidades de la arquitectura de red propuesta aplicándola a varias tareas en el modelado científico de la dinámica espaciotemporal, como los procesos de reacción-difusión.

Los métodos de aprendizaje automático convencionales tienen que depender de una gran cantidad de datos de entrenamiento y sufren problemas como mala interpretabilidad, generalización débil y errores de modelado incontrolables.

Precisión del modelo

Gracias al desarrollo reciente de enfoques basados ​​en datos, es posible aprender dinámicas espaciotemporales a partir de datos de medición y, al mismo tiempo, agregar conocimientos físicos previos. Según los investigadores, una de las principales ventajas de PeRCNN es que el conocimiento físico previo se puede codificar en la red, lo que garantiza que la red resultante obedece estrictamente a la física dada.

Esto tiene ventajas significativas para mejorar la convergencia y la precisión del modelo. Al codificar la estructura física dada en la red neuronal convolucional recurrente, se mejoró el rendimiento del modelado de sistemas dinámicos espaciotemporales basados ​​en datos escasos y ruidosos.

A través de extensos experimentos numéricos, los investigadores demostraron cómo se puede aplicar el enfoque propuesto para modelar y descubrir una variedad de procesos de reacción-difusión y otros sistemas de PDE. Al comparar el enfoque propuesto con algunos métodos existentes (también conocidos como modelos de línea de base), encontraron que el enfoque supera constantemente las líneas de base consideradas bajo diferentes niveles de ruido y riqueza de datos.

Además, los investigadores integraron la técnica de regresión dispersa con el modelo PeRCNN para descubrir la forma explícita de las PDE. El procedimiento completo consta de tres pasos: reconstrucción de datos, regresión dispersa y ajuste fino de coeficientes.

Los investigadores esperan que el enfoque, que combina el aprendizaje profundo y su conocimiento físico previo, sea aplicable en múltiples disciplinas, como el tecnológico.

 
 
Patrocinio Oro
Patrocinio Plata
Patrocinio Bronce
Salir de la versión móvil