Científicos del CMM presentarán innovador análisis sobre redes neuronales en NeurIPS 2024

Científicos del CMM presentarán innovador análisis sobre redes neuronales en NeurIPS 2024

El evento se celebrará del 10 al 15 de diciembre de 2024 en el Centro de Convenciones de Vancouver, Canadá.

El trabajo de investigación titulado “Simetrías en Redes Neuronales Sobreparametrizadas: un Enfoque de Campo Medio“, desarrollado por Joaquín Fontbona, coordinador del área de Ciencia de Datos e investigador del Centro de Modelamiento Matemático (CMM) de la Universidad de Chile, y Javier Maass, ingeniero matemático y Magíster en Matemáticas Aplicadas del Departamento de Ingeniería Matemática (DIM), ha sido seleccionado para presentarse en NeurIPS 2024, la conferencia más prestigiosa en inteligencia artificial (IA) y aprendizaje automático.

Este paper, basado en la tesis de Magister Maass, aborda cómo las redes neuronales sobreparametrizadas (aquellas con una cantidad muy grande de parámetros) aprenden al ser entrenadas con datos que presentan ciertas simetrías. Según Maass, se demostró cómo “el proceso de aprendizaje respeta dichas simetrías, lo que se refleja a su vez en una mayor eficiencia en los parámetros de las redes”. Esta investigación aporta una nueva perspectiva teórica sobre las capacidades de generalización de las redes neuronales y cómo diseñar arquitecturas más eficientes.

Comprensión de la IA

Las redes neuronales artificiales, una de las técnicas más exitosas en el campo del Machine Learning, han revolucionado áreas como la visión por computadora, el procesamiento del lenguaje natural y la robótica. Sin embargo, como señaló Maass, “no existe una comprensión teórica suficientemente completa de por qué son tan exitosas”. Este paper busca avanzar en esa comprensión, enfocándose en cómo aprovechar las simetrías de los datos para optimizar el rendimiento de las redes y su capacidad de generalización.

El impacto del trabajo no sólo es relevante desde una perspectiva matemática, sino también desde su potencial para desarrollar arquitecturas de redes más eficientes, lo que podría tener aplicaciones en una variedad de campos, desde la biomedicina hasta la ingeniería.

Simetrías en Redes Neuronales Sobreparametrizadas: un Enfoque de Campo Medio.

Inicio prometedor

La trigésimo octava conferencia anual sobre Sistemas de Procesamiento Neuronal de la Información (NeurIPS 2024), que se celebrará del 10 al 15 de diciembre de 2024 en el Centro de Convenciones de Vancouver, Canadá, es un evento interdisciplinario que reúne a expertos de diversas áreas como aprendizaje automático, neurociencia, estadística, optimización, visión por computador, procesamiento del lenguaje natural y otras ciencias afines. NeurIPS ofrece una oportunidad incomparable para presentar avances teóricos y prácticos que revolucionan sectores tan diversos como la biomedicina, la tecnología y las ciencias sociales.

Para Javier Maass, la selección en NeurIPS 2024 marca un hito crucial en sus primeros pasos dentro de la investigación académica. “Estaba muy nervioso por saber la noticia, cuando vi que era aceptado me puse muy feliz. Es un gran logro. Me encantaría que esta conferencia sirva para establecer vínculos internacionales y nuevas oportunidades para mi futuro académico”, afirmó. Cabe destacar que menos del 25% de los casi 16.000 papers sometidos a esta conferencia fueron aceptados. Este trabajo es además del 5% o menos, distinguidos como “spotlight”.

Investigación matemática para la IA

Por su parte, Joaquín Fontbona, destacó que “es un trabajo que, desde el modelamiento matemático, permite entender mejor cómo las redes neuronales reflejan las simetrías de los datos o las arquitecturas diseñadas para aprovecharlas, como las redes convolucionales, cuando hay un gran número de neuronas. Lo más interesante es que las matemáticas permiten dar respuestas precisas a preguntas sobre el comportamiento de estas redes, prediciendo su funcionamiento sin necesidad de hacer miles de experimentos o gastar muchos recursos”, lo que permite orientar mejor el desarrollo de nuevas tecnologías en IA.

El investigador del CMM resaltó el rol de Maass en el proyecto. “Fue el colaborador ideal, extremadamente motivado, con muchas ideas, grandes capacidades técnicas en matemáticas e informáticas, y una gran capacidad de trabajo. Aprendí mucho junto a él y de él y espero seguir colaborando con Javier en el futuro”, dijo.

La selección de este trabajo también representa un reconocimiento al esfuerzo que el DIM y el CMM han realizado en los últimos años en la intersección de las matemáticas y la inteligencia artificial.

“Formar investigadores jóvenes es crucial para que Chile cuente con talento y capacidades científicas propias en esta área, y que podamos desarrollar y utilizar la IA de manera más beneficiosa para nuestro país, aportando también a los desafíos de nivel global. No podemos conformarnos solo con ‘adoptar’ la IA”, expresó Fontbona.

Centro de Modelamiento Matemático

El CMM es hoy la institución de investigación científica más activa en modelación matemática en Latinoamérica. Es un centro de excelencia de la Agencia Nacional de Investigación y Desarrollo (ANID) de Chile, integrado por ocho universidades asociadas y ubicado en la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile. Además, es el Laboratorio Internacional de Investigación (IRL) #2807 del Centro Nacional de Investigación Científica (CNRS) de Francia.

Su misión es crear matemáticas para dar respuesta a problemas de otras ciencias, la industria y las políticas públicas. Busca desarrollar ciencia con los más altos estándares, excelencia y rigurosidad en áreas como ciencia de datos, clima y biodiversidad, educación, gestión de recursos, minería y salud digital.

Alonso Farías Ponce, periodista del Centro de Modelamiento Matemático.

Posted on Nov 6, 2024 in Frontpage, Noticias en castellano