CMM Data: Matemáticas que descifran los datos

CMM Data: Matemáticas que descifran los datos

En los últimos años, el mundo está asistiendo a una revolución de los datos. Gracias a la masificación de sensores, los avances en la capacidad computacional y el desarrollo matemático, existe un potencial para explicar fenómenos económicos, tecnológicos y sociales que ni siquiera habríamos soñado con entender antes. Es lo que llamamos data science.

Desde su fundación en el año 2000, el Centro de Modelamiento Matemático (CMM) de la Universidad de Chile ha estado involucrado en proyectos que exigen adquirir y estructurar bases de datos, formular metodologías para darle sentido a estas bases e interpretar los resultados. Dando un paso adelante en los desafíos que la ciencia de datos trae para la sociedad, academia e industria, el centro de investigación de excelencia suma desde 2018 una nueva área estratégica: CMM Data.

La creación de esta unidad se alinea con el desarrollo de soluciones matemáticas avanzadas para abordar problemas claves del país en las otras áreas estratégicas CMM: Bioinformática y Salud, Educación Matemática, Gestión de Recursos y Minería.

CMM Data se suma a otros hitos del centro en ciencia de datos como la realización de encuentros sobre esta disciplina en todo Chile desde 2008, la creación del Astroinformatics Lab en 2009, la implementación del Laboratorio Nacional de Computación de Alto Rendimiento (NLHPC) en 2011, la adquisición del supercomputador más potente del país en 2014, el desarrollo de soluciones en marketing analytics desde ese mismo año o la formación del Grupo de Aprendizaje de Máquinas, Inferencia y Señales por expertos nacionales, extranjeros y estudiantes en 2015.

A través de equipos multidisciplinarios y la infraestructura computacional más avanzada del país, el área canalizará proyectos intensivos en uso, volumen y técnicas de data science como la adquisición, transmisión y almacenamiento de datos; aprendizaje de máquinas; computación de alto rendimiento, y visualización.

Estas metodologías son transversales a las utilizadas por las otras áreas estratégicas aplicadas del centro y están a la vanguardia en la tarea de extraer el valor que esconden los datos.

“El dominio actual de estas herramientas, en general, provoca resultados que están todavía por debajo del potencial que tienen”, afirma Felipe Tobar, director del área. “Nuestro enfoque al análisis de datos es científico; además de implementar el estado del arte, nuestro interés es la investigación de nuevas tecnologías. El diseño de soluciones desde el punto de vista riguroso y formal de la ciencia permite entendimiento y seguridad de lo que estamos haciendo”.

Según Daniel Remenik, el otro director de la unidad, “al CMM lo diferencia su capacidad de modelamiento, además. Porque hay una batería de técnicas, de tipos de modelos que puedes usar en un problema. Pero también hay que entender ese problema y realmente modelar, que es una fase previa o paralela a la de data science en sí misma. El CMM tiene una experiencia única en la modelación de problemáticas que son relevantes para el país”.

Alianzas internacionales refuerzan el cumplimiento de esta misión. A las relaciones con Harvard University, Centre National de Recherche Scientifique, INRIA, École Polytechnique, Collège de France y otros referentes de clase mundial en investigación, se suman recientes colaboraciones con el MIT y Amazon Web Services. Su afiliación a la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile también le permite estar al día y en contacto con profesionales de múltiples áreas. Junto a ellos, investigadores del CMM pueden contribuir a la solución de temáticas urgentes para Chile. Participar en la vida académica acerca el centro a algunos de los talentos jóvenes más promisorios del país.

Proyectos que impactan

“Hay muchos temas de interés para el país donde las técnicas conocidas de manera más amplia no bastan, porque las soluciones no han sido desarrolladas aún o porque el problema es muy complejo. Ahí, es donde el CMM tiene algo que aportar”, afirma Remenik.

En la actualidad, se están llevando a cabo proyectos en marketing analytics, seguridad ocupacional, astroinformática, riesgo en microcréditos, logística, retail, detección de transacciones financieras fraudulentas, sustentabilidad medioambiental y seguridad pública. Un desafío especial es la ampliación de Leftraru, el supercomputador más poderoso de Chile, que cuadriplicará su potencia.

En algunos casos, la tarea del CMM es desarrollar nuevas herramientas para resolver problemas con volúmenes de datos que pueden venir en grandes cantidades o no estar bien estructurados. En otros, encontrar los desafíos que instituciones y empresas pueden solucionar con las técnicas contemporáneas. También hay situaciones donde respuestas ya diseñadas por el centro pueden servir a problemáticas emergentes. Y existen otras tecnologías de punta desarrolladas por el CMM que servirán a las consultoras de data analysis que están apareciendo hoy.

“Nos encargamos de problemas que se distinguen por su magnitud y la necesidad de innovar en su solución. l tema tiene que ver con nuestra motivación de dedicarle esfuerzos a la resolución de problemas que requieran aportes originales desde las matemáticas”, explica Remenik.

La formación de capital humano también es una veta por donde avanza el área. Sus investigadores han dictado cursos de data science para organismos internacionales, instituciones públicas y empresas. También están involucrados en la creación de programas de postgrado y ramos en el pregrado. Porque algo que se sabe sí o sí es que la necesidad de científicos expertos en datos seguirá creciendo en el futuro.

“Es cierto que hay información escondida en los datos y el análisis de datos busca esta información. Pero sigo manteniendo la idea de que, a pesar de que el valor está en los datos, este solo puede ser extraído a través de técnicas desarrolladas para este fin. Esto es lo que hacemos en el CMM”, concluye Tobar.

Posted on Jun 12, 2018 in Noticias en castellano