La pandemia de coronavirus nos ha separado físicamente y nos recuerda el poder de la tecnología para conectarnos. Cuando el MIT cerró sus puertas en marzo, gran parte del campus se mudó en línea a clases virtuales, laboratorios y salas de chat. Entre los que estaban en el centro se encontraban estudiantes dedicados a la investigación independiente bajo el Programa de Oportunidades de Investigación de Pregrado (UROP) del MIT.

Con controles regulares en sus asesores a través de Slack y Zoom, muchos estudiantes lograron llegar hasta el final. Uno incluso continuó sus experimentos desde su habitación, después de arrastrar sus robots Sphero Bolt a casa en una mochila. «Estoy muy impresionada con su resistencia y dedicación», dijo Katherine Gallagher, una de las tres ingenieras de inteligencia artificial en MIT Quest for Intelligence que trabaja con estudiantes en aplicaciones relacionadas con la inteligencia cada semestre. «Hubo esa primera semana de locura y luego volvieron al trabajo». Cuatro de los proyectos de esta primavera se destacan a continuación.

Aprender a descubrir el mundo con los ojos y oídos abiertos.

Los robots dependen en gran medida de las imágenes emitidas por sus cámaras incorporadas, o de «ojos» sustitutos para moverse. Alon Kosowsky-Sachs, senior del MIT, piensa que podrían hacer mucho más si también usaran sus oídos de micrófono.

Desde su hogar en Sharon, Massachusetts, donde se retiró después de que el MIT cerró en marzo, Kosowsky-Sachs entrena a cuatro robots Sphero Bolt del tamaño de una pelota de béisbol para rodar por una arena casera. Su objetivo es enseñar a los robots a vincular imágenes y sonidos y utilizar esta información para crear una mejor representación de su entorno. Trabaja juntos Pulkit Agrawal, profesor asistente en el Departamento de Ingeniería Eléctrica e Informática del MIT, interesado en diseñar algoritmos con curiosidad humana.

Mientras Kosowsky-Sachs está dormido, sus robots resbalan y se deslizan a través de una pista de hielo repleta de objetos que construyó para ellos de dos en cuatro. Cada ráfaga de movimiento se convierte en un par de clips de video y audio de un segundo. Durante el día, Kosowsky-Sachs entrena un ‘modelo de curiosidad’ destinado a alentar a los robots a ser más audaces y más hábiles para navegar su carrera de obstáculos.

«Quiero que vean algo a través de su cámara y escuchen algo de su micrófono, y sepan que estas dos cosas están sucediendo juntas», dice. “Como humanos, combinamos mucha información sensorial para obtener más información sobre el mundo. Cuando escuchamos un trueno, no necesitamos ver relámpagos para saber que ha llegado una tormenta. Nuestra hipótesis es que los robots con un mejor modelo mundial podrán realizar tareas más difíciles. «

Capacitación de un agente robot para diseñar un reactor nuclear más eficiente

Un factor importante que impulsa el costo de la energía nuclear es la disposición del núcleo del reactor. Cuando las barras de combustible están dispuestas de manera óptima, las reacciones durarán más, quemarán menos combustible y requerirán menos mantenimiento. Si bien los ingenieros están buscando formas de reducir el costo de la energía nuclear, están estudiando el rediseño del núcleo del reactor.

«La energía nuclear emite muy poco carbono y es sorprendentemente segura en comparación con otras fuentes de energía, incluso el sol o el viento», dijo el estudiante de tercer año Isaac Wolverton. «Queríamos ver si podíamos usar IA para hacerlo más eficiente».

En un proyecto con Josh Joseph, ingeniero de IA en MIT Quest, y Koroush Shirvan, profesor asistente en el departamento de ciencia e ingeniería nuclear del MIT, Wolverton pasó el año entrenando a un asistente de refuerzo para maestros para encontrar la mejor manera de colocar barras de combustible en el núcleo del reactor. Para simular el proceso, convirtió el problema en un juego y tomó prestada una técnica de aprendizaje automático para producir agentes con habilidades sobrehumanas en ajedrez y Go.

Comenzó a entrenar a su agente en un problema más simple: colocar fichas de colores en una cuadrícula para que se pudieran tocar la menor cantidad posible de fichas del mismo color. Cuando Wolverton aumentó la cantidad de opciones, de dos colores a cinco y cuatro fichas a 225, se emocionó mientras el agente continuaba buscando la mejor estrategia. «Nos dio la esperanza de que pudiéramos aprender a cambiar los núcleos en una configuración óptima», dice.

Finalmente, Wolverton se mudó a un entorno destinado a simular un núcleo de reactor de 36 barras, con dos niveles de enriquecimiento y 2,1 millones de configuraciones posibles de núcleo. Con el aporte de investigadores del laboratorio de Shirvan, Wolverton entrenó a un agente para encontrar la solución óptima.

El laboratorio ahora se basa en el código de Wolverton para intentar capacitar a un agente en un entorno de tamaño natural con 100 empleados y 19 niveles de enriquecimiento. «No hay avance en este momento», dice. «Pero creemos que es posible si podemos encontrar suficientes recursos informáticos».

Hacer más hígados disponibles para pacientes que los necesitan

Alrededor de 8,000 pacientes en los Estados Unidos reciben trasplantes de hígado cada año, pero eso es solo la mitad de los que necesitan uno. Los investigadores dicen que podrían estar disponibles muchos más hígados si los hospitales tuvieran una forma más rápida de detectarlos. En asociación con el Hospital General de Massachusetts, MIT Quest está evaluando si la automatización puede ayudar a aumentar la gama de hígados viables del país.

Al aprobar un hígado para trasplante, los patólogos estiman el contenido de grasa de un trozo de tejido. Si es lo suficientemente bajo, el hígado se considera listo para el trasplante. Pero a menudo no hay suficientes médicos calificados para calificar las muestras de tejido en el apretado cronograma requerido para unir los hígados con los receptores. La escasez de médicos, combinada con la naturaleza subjetiva del análisis de tejidos, significa que los hígados viables se descartan inevitablemente.

Esta pérdida presenta una gran oportunidad para el aprendizaje automático, dijo el estudiante de tercer año Kuan Wei Huang, quien se unió al proyecto para explorar aplicaciones de IA en la industria de la salud. El proyecto implica entrenar una red neuronal profunda para seleccionar cucharadas de grasa en portaobjetos de tejido hepático para estimar el contenido total de grasa del hígado.

Un desafío, dice Huang, es descubrir cómo lidiar con las variaciones en cómo los diferentes patólogos clasifican los glóbulos de grasa. «Esto hace que sea más difícil ver si hice las máscaras adecuadas para alimentar la red neuronal», dice. «Pero después de reunirme con expertos en el campo, obtuve una aclaración y pude seguir trabajando».

El modelo ha sido entrenado en imágenes etiquetadas por patólogos y eventualmente aprenderá a aislar glóbulos de grasa por su cuenta en imágenes sin etiqueta. El resultado final es una estimación del contenido de grasa con imágenes de glóbulos de grasa marcados que muestran cómo el modelo llegó a su conteo final. «Esa es la parte fácil: solo contamos los píxeles en las cuentas marcadas como un porcentaje de la biopsia total y tenemos nuestra estimación del contenido de grasa», dijo Gallagher, de Quest, quien lidera el proyecto.

Huang dice que está entusiasmado con el potencial del proyecto para ayudar a las personas. «Usar el aprendizaje automático para abordar problemas médicos es una de las mejores formas en que un científico de TI puede impactar al mundo».

Descubre las limitaciones ocultas de lo que queremos decir en lo que decimos

El lenguaje da forma a nuestra comprensión del mundo de manera sutil, con ligeras variaciones en las palabras que usamos que transmiten significados muy diferentes. La frase «Los elefantes viven en África y Asia» es muy similar a la frase «Los elefantes comen ramas y hojas». Pero la mayoría de los lectores concluirán que los elefantes en la primera oración se dividen en diferentes grupos que viven en continentes separados, pero no aplican el mismo razonamiento a la segunda oración, porque comer ramitas y comer hojas puede ser cierto para la misma Elefante de una manera que viven en diferentes continentes no puede.

Karen Gu es una estudiante de último año en ciencias de la computación y biología molecular, pero en lugar de poner las células bajo un microscopio para su proyecto SuperUROP, eligió mirar oraciones como la de arriba. «Me fascinan las cosas complejas y sutiles que hacemos para limitar la comprensión del lenguaje, casi todas ellas inconscientemente», dice ella.

Trabajar con Roger Levy, profesor en el Departamento de Ciencias Cognitivas y Cerebrales del MIT, y postdoc MH Tessler, Gu exploró cómo la información interna significa nuestra interpretación de la sintaxis y, en última instancia, el significado. En las oraciones anteriores, el conocimiento previo sobre geografía y exclusividad mutua interactúa con la sintaxis para producir diferentes significados.

Después de estudiar teoría lingüística, Gu construyó un modelo para explicar cómo una oración proporciona significado por palabra. Luego realizó una serie de experimentos en línea para ver cómo los sujetos humanos interpretarían oraciones análogas en una historia. Sus experimentos son intuiciones ampliamente validadas de la teoría del lenguaje.

Un desafío, dice ella, era conciliar dos enfoques para el estudio del idioma. «Tuve que descubrir cómo combinar la lingüística formal, que adopta un enfoque casi matemático para comprender cómo se combinan las palabras, y la semántica-pragmática probabilística, que se centra más en cómo las personas interpretan enunciados completos».

Después de cerrar en marzo, el MIT pudo completar el proyecto desde la casa de sus padres en East Hanover, Nueva Jersey. «Las reuniones regulares con mi asesor realmente me motivaron y me mantuvieron encaminado», dice ella. Ella dice que también ha tenido que mejorar sus habilidades de desarrollo web, lo que será útil cuando se una a Benchling, una compañía de software con sede en San Francisco, este verano.

Los proyectos Quest UROP del semestre de primavera fueron financiados en parte por el MIT-IBM Watson AI Lab y Eric Schmidt, asesor técnico de Alphabet Inc., y su esposa, Wendy.



Source link