Desarrollado por los ingenieros de la Universidad de Michigan (EE.UU.), el modelo OptoGPT produce diseños para estructuras de películas multicapa en 0,1 segundos, casi instantáneamente. Con este modelo se puede mejorar la fabricación de semiconductores con luz ultravioleta extrema y hacer que los edificios regulen mejor el calor con ventanas inteligentes que se vuelven más transparentes o reflectantes según la temperatura.
El modelo OptoGPT utiliza las redes neuronales de transformadores que impulsan los modelos de lenguaje de gran tamaño y aprovecha la arquitectura informática que sustenta ChatGPT para trabajar hacia atrás, desde las propiedades ópticas deseadas hasta la estructura del material que puede proporcionarlas. Asimismo, se entrena con una gran cantidad de datos y puede responder bien a tareas generales de diseño óptico en todo el campo.
Los fabricantes de células solares, telescopios y otros componentes ópticos podrían diseñar mejores dispositivos más rápidamente con inteligencia artificial (IA). El nuevo algoritmo diseña estructuras de película multicapa óptica (capas delgadas apiladas de diferentes materiales) que pueden cumplir una variedad de propósitos. Las estructuras multicapa bien diseñadas pueden maximizar la absorción de luz en una célula solar u optimizar la reflexión en un telescopio.
Para automatizar el proceso de diseño de estructuras ópticas, el equipo de investigación diseñó una arquitectura de transformador (el marco de aprendizaje automático utilizado en grandes modelos de lenguaje como ChatGPT de OpenAI y Bard de Google) para sus propios fines.
El modelo trata los materiales de un determinado espesor como palabras y también codifica sus propiedades ópticas asociadas como entradas. Al buscar correlaciones entre estas ‘palabras’, el modelo predice la siguiente palabra para crear una ‘frase’ (en este caso, un diseño para una estructura de película multicapa óptica) que logre la propiedad deseada, como una alta reflexión.
Rendimiento del modelo OptoGPT
Los investigadores probaron el rendimiento del nuevo modelo utilizando un conjunto de datos de validación que contenía 1.000 estructuras de diseño conocidas, incluida su composición material, espesor y propiedades ópticas. Al comparar los diseños de OptoGPT con el conjunto de validación, la diferencia entre los dos fue de solo el 2,58%, inferior a las propiedades ópticas más cercanas en el conjunto de datos de entrenamiento, que fue del 2,96%.
Si los investigadores están concentrados en una tarea, como diseñar un revestimiento de alta eficiencia para enfriamiento radiativo, pueden usar la optimización local (ajustar las variables dentro de ciertos límites para lograr el mejor resultado posible) para ajustar aún más el espesor y mejorar la precisión. Durante las pruebas, los investigadores descubrieron que el ajuste fino mejora la precisión en un 24%, lo que reduce la diferencia entre el conjunto de datos de validación y las respuestas de OptoGPT al 1,92%.
Llevando el análisis un paso más allá, los investigadores utilizaron una técnica estadística para trazar las asociaciones que realiza OptoGPT. Cuando se representan en un espacio 2D, los materiales se agrupan por tipo, como metales y materiales dieléctricos, que son aislantes eléctricos, pero pueden soportar un campo eléctrico interno. Todos los dieléctricos, incluidos los semiconductores, convergen en un punto central a medida que el espesor se acerca a los 10 nanómetros. Desde una perspectiva óptica, el patrón tiene sentido ya que la luz se comporta de manera similar independientemente del material a medida que se acercan a espesores tan pequeños, lo que ayuda a validar aún más la precisión de OptoGPT.