Saltar al contenido

Estudiando las estrellas con aprendizaje automático.

noviembre 10, 2018
ciencia - Header Machine learning 0 1 1024x576

Kevin Schawinski tuvo un problema.

En 2007, fue astrofísico en la Universidad de Oxford y trabajó arduamente en la revisión de siete años de fotografías de Sloan Digital Sky Survey, imágenes de más de 900,000 galaxias. Pasó sus días mirando imagen tras imagen, observando si una galaxia parecía espiral o elíptica, o registrando de qué manera parecía estar girando.

Los avances tecnológicos habían acelerado la capacidad de los científicos para recopilar información, pero los científicos todavía estaban procesando la información al mismo ritmo. Después de trabajar en la tarea a tiempo completo y apenas hacer mella, Schawinski y su colega Chris Lintott decidieron que tenía que haber una mejor manera de hacerlo.

Hubo: un proyecto de ciencia ciudadana llamado Galaxy Zoo. Schawinski y Lintott reclutaron voluntarios del público para ayudar a clasificar imágenes en línea. Mostrar las mismas imágenes a varios voluntarios les permitió verificar el trabajo del otro. Más de 100,000 personas contribuyeron y condensaron una tarea que habría llevado años en poco menos de seis meses.

Los científicos ciudadanos continúan contribuyendo a las tareas de clasificación de imágenes. Pero la tecnología también sigue avanzando.

El Instrumento Espectroscópico de Energía Oscura, programado para comenzar en 2019, medirá las velocidades de unos 30 millones de galaxias y quásares durante cinco años. El Telescopio de Levantamiento Sinóptico Grande, programado para comenzar a principios de 2020, recopilará más de 30 terabytes de datos cada noche, durante una década.

“El volumen de los conjuntos de datos [from those surveys] será al menos un orden de magnitud más grande “, dice Camille Avestruz, investigadora postdoctoral en la Universidad de Chicago.

Para mantenerse al día, los astrofísicos como Schawinski y Avestruz han reclutado una nueva clase de científicos no científicos: las máquinas.

Los investigadores están utilizando inteligencia artificial para ayudar con una variedad de tareas en astronomía y cosmología, desde el análisis de imágenes hasta la programación de telescopios.

Programación sobrehumana, calibración computarizada.

Inteligencia artificial es un término general para las maneras en que las computadoras parecen razonar, tomar decisiones, aprender y realizar otras tareas que asociamos con la inteligencia humana. El aprendizaje automático es un subcampo de inteligencia artificial que utiliza técnicas estadísticas y reconocimiento de patrones para capacitar a las computadoras para tomar decisiones, en lugar de programar algoritmos más directos.

En 2017, un grupo de investigación de la Universidad de Stanford usó el aprendizaje automático para estudiar imágenes de lentes gravitacionales fuertes, un fenómeno en el que una acumulación de materia en el espacio es lo suficientemente densa como para doblar las ondas de luz a medida que viajan a su alrededor.

Debido a que muchas lentes gravitacionales no pueden ser explicadas solo por la materia luminosa, una mejor comprensión de las lentes gravitacionales puede ayudar a los astrónomos a comprender mejor la materia oscura.

En el pasado, los científicos han realizado esta investigación comparando imágenes reales de lentes gravitacionales con un gran número de simulaciones por computadora de modelos matemáticos de lentes, un proceso que puede tomar semanas o incluso meses para una sola imagen. El equipo de Stanford demostró que los algoritmos de aprendizaje automático pueden acelerar este proceso por un factor de millones.

Schawinski, quien ahora es astrofísico en ETH Zurich, utiliza el aprendizaje automático en su trabajo actual. Su grupo ha utilizado herramientas denominadas redes de confrontación generativa, o GAN, para recuperar versiones limpias de imágenes degradadas por ruido aleatorio. Recientemente publicaron un artículo sobre el uso de la IA para generar y probar nuevas hipótesis en astrofísica y otras áreas de investigación.

Otra aplicación del aprendizaje automático en astrofísica consiste en resolver problemas logísticos, como la programación. Solo hay tantas horas en una noche que se puede usar un telescopio de alta potencia, y solo puede apuntar en una dirección a la vez. “Cuesta millones de dólares usar un telescopio en el orden de semanas”, dice Brian Nord, físico de la Universidad de Chicago y parte de Machine Intelligence Group del Fermilab, que tiene la tarea de ayudar a los investigadores en todas las áreas de alta energía. La física despliega a la IA en su trabajo.

El aprendizaje automático puede ayudar a los observatorios a programar telescopios para que puedan recopilar datos de la manera más eficiente posible. Tanto el laboratorio de Schawinski como el Fermilab están utilizando una técnica llamada aprendizaje por refuerzo para entrenar algoritmos para resolver problemas como este. En el aprendizaje por refuerzo, un algoritmo no se entrena en respuestas “correctas” e “incorrectas”, sino a través de diferentes recompensas que dependen de sus resultados. Los algoritmos deben encontrar un equilibrio entre los beneficios seguros y predecibles de las opciones entendidas y el potencial de una gran victoria con una solución inesperada.

Un campo en crecimiento

Cuando Shubhendu Trivedi, estudiante de posgrado en ciencias de la computación del Instituto Tecnológico de Toyota en la Universidad de Chicago, comenzó a impartir un curso de posgrado sobre aprendizaje profundo con uno de sus mentores, Risi Kondor, se mostró satisfecho con la cantidad de investigadores de ciencias físicas que se inscribieron. No sabían mucho sobre cómo usar la inteligencia artificial en su investigación, y Trivedi se dio cuenta de que los expertos en aprendizaje automático no tenían una gran necesidad de ayudar a los científicos en diferentes campos a encontrar formas de explotar estas nuevas técnicas.

Las conversaciones que tuvo con investigadores de su clase evolucionaron a colaboraciones, incluida la participación en Deep Skies Lab, un grupo de investigación en astronomía e inteligencia artificial cofundado por Avestruz, Nord y el astrónomo Joshua Peek del Instituto de Ciencia del Telescopio Espacial. A principios de este mes, presentaron su primer artículo revisado por pares que demostraba la eficacia de un método basado en la IA para medir lentes gravitacionales en el Fondo de Microondas Cósmico.

Grupos similares están apareciendo en todo el mundo, desde el grupo de Schawinski en Suiza hasta el Centro de Astrofísica y Supercomputación en Australia. Y la adopción de técnicas de aprendizaje automático en astronomía está aumentando rápidamente. En una búsqueda en arXiv de artículos de astronomía, los términos “aprendizaje profundo” y “aprendizaje automático” aparecen más en los títulos de los artículos de los primeros siete meses de 2018 que en todo el 2017, que a su vez tuvo más del 2016.

“Hace cinco años, [machine learning algorithms in astronomy] eran herramientas esotéricas que se desempeñaban peor que los humanos en la mayoría de las circunstancias ”, dice Nord. Hoy en día, más y más algoritmos están superando consistentemente a los humanos. “Te sorprendería la cantidad de fruta baja que hay”.

Pero existen obstáculos para introducir el aprendizaje automático en la investigación astrofísica. Uno de los más grandes es el hecho de que el aprendizaje automático es una caja negra. “No tenemos una teoría fundamental sobre cómo funcionan las redes neuronales y cómo le dan sentido a las cosas”, dice Schawinski. Los científicos están comprensiblemente nerviosos por el uso de herramientas sin entender completamente cómo funcionan.

Otro obstáculo relacionado es la incertidumbre. El aprendizaje automático a menudo depende de entradas que todos tienen cierta cantidad de ruido o error, y los propios modelos hacen suposiciones que introducen incertidumbre. Los investigadores que utilizan técnicas de aprendizaje automático en su trabajo deben comprender estas incertidumbres y comunicarse con precisión entre ellos y con el público en general.

El estado del arte en el aprendizaje automático está cambiando tan rápidamente que los investigadores se muestran reacios a hacer predicciones sobre lo que sucederá en los próximos cinco años. “Me sentiría realmente emocionado si tan pronto como los datos salgan de los telescopios, una máquina podría mirarlos y encontrar patrones inesperados”, dice Nord.

Independientemente de la forma que tomen los avances futuros, los datos siguen llegando cada vez más rápido, y los investigadores están cada vez más convencidos de que la inteligencia artificial será necesaria para ayudarlos a mantenerse al día.