Procesador óptico de IA para reducir el consumo de energía del centro de datos...
HogarHogar > Noticias > Procesador óptico de IA para reducir el consumo de energía del centro de datos...

Procesador óptico de IA para reducir el consumo de energía del centro de datos...

Nov 16, 2023

Investigadores del MIT de EE. UU. y de la Technische Universitat de Berlín han construido un procesador de red neuronal óptica con láseres integrados que reduce drásticamente el consumo de energía de modelos de lenguaje de inteligencia artificial de gran tamaño, como GPT4.0.

La arquitectura 3D se basa en conjuntos de láseres emisores de superficie verticales (VCSEL) de última generación desarrollados por el grupo Reitzenstein de la Universidad Técnica de Berlín. Esto proporciona una mejora de 100 veces en la eficiencia energética y una mejora de 20 veces en la densidad informática.

"Este fue un proyecto de colaboración que no habría sido posible sin ellos", dice el investigador Ryan Hamerly del Laboratorio de Investigación en Electrónica (RLE) del MIT, quien patentó el diseño con sus colegas.

El sistema puede alcanzar una eficiencia energética de 7 femtojulios por operación (OP) con una densidad de cálculo de 6 TOP/mm2/s1, lo que representa mejoras 100 y 20 veces, respectivamente, con respecto a los procesadores digitales de última generación. El desarrollo a corto plazo podría mejorar estas métricas en dos órdenes de magnitud más, abriendo tareas de aprendizaje automático desde centros de datos a dispositivos descentralizados.

“Esperamos que pueda ampliarse para uso comercial en unos años. Por ejemplo, los conjuntos de láser involucrados se usan ampliamente en la identificación facial de teléfonos celulares y en la comunicación de datos”, dice Zaijun Chen, primer autor, quien realizó el trabajo mientras era postdoctorado en el MIT en RLE y ahora es profesor asistente en la Universidad del Sur. California.

“ChatGPT tiene un tamaño limitado por la potencia de las supercomputadoras actuales. Simplemente no es económicamente viable entrenar modelos mucho más grandes. Nuestra nueva tecnología podría hacer posible dar un salto hacia modelos de aprendizaje automático que de otro modo no serían alcanzables en un futuro próximo”, afirmó Dirk Englund, profesor asociado en el Departamento de Ingeniería Eléctrica e Informática del MIT y líder del trabajo.

"No sabemos qué capacidades tendrá el ChatGPT de próxima generación si es 100 veces más potente, pero ese es el régimen de descubrimiento que este tipo de tecnología puede permitir". Englund también es líder del Laboratorio de Fotónica Cuántica del MIT y está afiliado al RLE y al Laboratorio de Investigación de Materiales.

Otros coautores del artículo actual de Nature Photonics son Alexander Sludds, Ronald Davis, Ian Christen, Liane Bernstein y Lamia Ateshian, todos de RLE; y Tobias Heuser, Niels Heermeier, James A. Lott y Stephan Reitzensttein de la Technische Universitat Berlin.

Chen, Hamerly y Englund solicitaron una patente para el trabajo, que fue patrocinado por la Oficina de Investigación del Ejército de EE. UU. y NTT Research en Japón, así como por la Fundación Volkswagen en Alemania.

www.mit.edu; www.nature.com/articles/s41566-023-01233-w