El trabajo de Ellis dirigido por Nuria Oliver recogido en la prestigiosa revista WIRED

La mítica revista estadounidense Wired, de tecnología y tendencias ha publicado un artículo sobre el trabajo llevado a cabo por la Fundación Ellis con Covid19ImpactSurvey  un proyecto en el que un equipo multidisciplinar liderado Nuria Oliver, ingeniera de telecomunicación y doctora en Ciencias de la Computación por el MIT, cuyo objetivo es realizar un seguimiento de las actuaciones así como aconsejar, a partir del análisis de los datos, las actuaciones necesarias, sobre todo en el contexto de la propagación del coronavirus.

Reproducimos aquí el artículo traducido:

Cómo Valencia aplastó a Covid con IA

Aprovechando algoritmos y fuentes de datos poco ortodoxas, un investigador del MIT ha convertido a Valencia en un pionero de datos de Covid-19.

Cuando la Covid-19 llegó a España la primavera pasada, el país llegó rápidamente al punto de ruptura. En Madrid, los médicos describieron una “avalancha” de pacientes que practicaban “medicina de combate” y triaje de emergencia en unidades de cuidados intensivos que operaban en pie de guerra. La primera muerte de Covid-19 se registró el 1 de marzo. Un mes después, poco menos de mil personas morían cada día. Las ambulancias obstruyeron las carreteras de acceso a los hospitales y las pistas de hielo se transformaron en morgues.

A mediados de marzo, cuando el virus se extendió por todas las regiones de España, Nuria Oliver se dio cuenta de que esta amenaza mal entendida requería una acción inmediata. Oliver, que es científica de datos, se sintió particularmente bien calificada para ayudar con esta crisis de salud pública: en sus roles anteriores en gigantes de las telecomunicaciones, había desarrollado herramientas que utilizan datos de GPS para rastrear la propagación de la influenza H1N1 en México, el ébola en el país democrático. República del Congo y malaria en Mozambique. “El contexto estaba ahí y el momento era el adecuado”, dice ella. Oliver se acercó a los contactos de su gobierno local en la región de Valencia y les explicó cómo los datos podrían ayudar a combatir la crisis que se está desarrollando.

Oliver, oriundo de Alicante, se doctoró en 2000 en el Instituto Tecnológico de Massachusetts. Para su tesis, había creado algoritmos que usaban video y otras entradas sensoriales para detectar, reconocer y predecir automáticamente varias formas de interacción humana. Posteriormente, pasó más de siete años en un equipo de investigación en Microsoft, luego ocupó puestos de responsabilidad en las empresas de telecomunicaciones Telefónica y Vodafone, donde se ganó una reputación mundial por su trabajo modelando el comportamiento humano, antes de regresar a su ciudad natal por razones personales.

En 2019, pocos meses antes de la pandemia, el gobierno regional de Valencia le pidió a Oliver que lo ayudara a desarrollar una nueva estrategia que incorporaría la inteligencia artificial en su metodología de gobierno. La Generalitat Valenciana es una de las varias regiones españolas que disfruta de un mayor grado de autonomía y, entusiasmada por la oportunidad, Oliver se dedicó al proyecto. Como divulgadora de la inteligencia artificial y el aprendizaje automático en la formulación de políticas (a menudo participa en eventos públicos con títulos optimistas como “AI for Good”), Oliver siempre había querido cambiar la forma en que los gobiernos aprovechan la inteligencia artificial.

“El sueño es hacer que el gobierno sea más eficiente, hacer que el gobierno sea más eficaz y permitir decisiones que se basen en la evidencia y el conocimiento científico”, dice. “Tenemos las herramientas para poder hacer esto”. Aunque el uso de inteligencia artificial se ha vuelto relativamente común en las grandes empresas de tecnología e ingeniería durante la última década, todavía es inusual que los gobiernos utilicen tales sistemas con éxito. Un documento de investigación reciente de la OCDE encontró que solo 36 países en todo el mundo habían desarrollado una estrategia nacional de IA que se enfocaba en el sector público, y solo una fracción de ellos había comenzado a implementarla en el mundo real. Valencia publicó su propia nueva estrategia de IA, desarrollada en consulta con Oliver, en noviembre de 2019.

Cuando llegó la pandemia, a pesar de su horror, Oliver lo vio como una oportunidad para aplicar sus teorías sobre la utilidad de los datos para las políticas públicas a gran escala. Fue nombrada la primera comisionada de IA de Valencia y tuvo la suerte de encontrar un alma gemela, Ana Berenguer, trabajando en el corazón mismo de la maquinaria del gobierno regional. Ex abogado, Berenguer supervisó análisis y políticas públicas en el gabinete del presidente de Valencia, Ximo Puig. Se aseguró de que Oliver se uniera a un panel de otros expertos (economistas, epidemiólogos y médicos) que informaría a Puig semanalmente o quincenalmente y le ofrecería recomendaciones sobre la mejor manera de contener el virus. Mientras miraba los rostros de los demás participantes en esas primeras reuniones de videoconferencia, Berenguer recuerda: se dio cuenta de lo diferente que era su enfoque del de Oliver. “Habían sido, tradicionalmente, extremadamente escépticos sobre el trabajo, especialmente el lado epidemiológico del trabajo que estábamos haciendo con los datos”. Oliver no se inmutó, pero reconoció que la tarea que tenía por delante requeriría una cantidad significativa de apoyo. Armada con este mandato oficial, corrió para construir una potencia epidemiológica impulsada por datos mediante la contratación de un equipo voluntario multidisciplinario de alrededor de dos docenas de científicos, investigadores y académicos.

Miguel Angel Lozano, investigador en informática de la Universidad de Alicante en el sur de España, vio uno de los primeros correos electrónicos de Oliver pidiendo ayuda. Durante dos décadas, Lozano había investigado y dado conferencias sobre informática, con un enfoque reciente en delinear patrones en sistemas complejos como las redes de transporte público. “Creo que todos quieren ayudar con esta situación”, recuerda haber pensado Lozano. Aceptó participar y rápidamente vio dónde su experiencia con el mapeo de datos de transporte podría ser útil.

Sobre la base de su trabajo anterior con Telefónica y Vodafone, Oliver sabía que medir y comprender la movilidad podría ser crucial para evitar la propagación del virus. “Si no nos movemos, no hay pandemia”, así lo expresa. Por casualidad, el Instituto Nacional de Estadística de España había comenzado recientemente a examinar datos de telecomunicaciones anonimizados de tres grandes empresas de telefonía móvil, con fines económicos y para monitorear los movimientos de la fuerza laboral del país durante las horas pico, entre otras cosas. Después de algunas negociaciones, Oliver y su equipo obtuvieron acceso exclusivo a estos mismos datos de movilidad y, dice Lozano, “aplicaron algunos de los métodos en los que estábamos trabajando a esta información”.

Francisco Escolano, otro informático de la Universidad de Alicante que se había unido al equipo de Oliver, encontró que las hojas de cálculo de datos de movilidad entregadas por los estadísticos eran considerables, pero también relativamente básicas: simplemente mostraban que un número específico de personas se movía de un área a otra en un período de tiempo especificado. Para hacer que esos datos sean más útiles en la práctica, Escolano ayudó a desarrollar un sistema que traduciría las hojas de cálculo de los estadísticos al lenguaje de codificación Python. Esto no solo les permitió estudiar los datos más de cerca, sino también crear imágenes claras que pudieran ser entendidas por los tomadores de decisiones políticas.

Los científicos de Oliver obtuvieron datos de una variedad de otras fuentes. Buscaron comunicados públicos de empresas como Facebook y Google, en busca de datos complementarios que cubrieran cualquier brecha. También desarrollaron una encuesta digital para los residentes de Valencia, cuyas preguntas cambiaron con el tiempo a medida que evolucionaba la pandemia.

Las encuestas fueron sorprendentemente bien recibidas por los residentes, con más de 140.000 respuestas en las primeras 40 horas . Durante los meses siguientes, generaron cientos de miles de respuestas más, puntos de datos, que ayudaron a la Generalitat a ver lo que pensaba y sentía su población casi en tiempo real. Las respuestas incluyeron la ubicación, el momento y la forma de la mezcla social, las medidas de protección personal que estaban tomando los residentes, cómo percibían la seguridad relativa de las diferentes actividades, desde la compra de comestibles hasta la cena en un restaurante, y si las personas se sentían lo suficientemente seguras financieramente como para aislarse si fuera necesario. “Hemos podido responder preguntas que de otro modo no hubiéramos podido responder”, dice Oliver.

Los resultados de la encuesta resultaron especialmente efectivos durante las reuniones del gabinete, dice Berenguer, porque mostraron a los políticos cómo el comportamiento estaba cambiando de una manera que podían entender fácilmente. Si las personas sonaran como si estuvieran bajando la guardia y socializando con demasiada libertad, por ejemplo, el gobierno podría iniciar una nueva campaña de concientización pública alentando el cumplimiento del uso de máscaras o el distanciamiento social. Pero los aumentos autoinformados en la interacción social también podrían ayudar a mejorar la precisión de las estimaciones del número de casos.

El equipo también desarrolló otros modelos predictivos basados ​​en el aprendizaje automático. Uno les permitió pronosticar la prevalencia de Covid-19 en un área determinada en un momento dado; otro les ayudó a analizar las aguas residuales de baños, lavabos, lavadoras y duchas, y a buscar anomalías que pudieran reflejar cambios en las tasas de infección local. Un tercero les permitió predecir las tasas de hospitalización futuras, reconociendo cuándo las unidades de cuidados intensivos podrían alcanzar su capacidad. Esto resultó de gran ayuda para las autoridades sanitarias locales a medida que avanzaba la pandemia, lo que les permitió trasladar personal y equipos por la región para satisfacer la demanda esperada.

Durante la primera y segunda oleadas, Valencia se salvó de lo peor de la pandemia; en la primera semana de abril de 2020, por ejemplo, los madrileños morían a una tasa cuatro veces superior a la de Valencia. A principios de noviembre de 2020, Valencia tenía el número más bajo de infecciones totales acumuladas por tamaño de población de todas las regiones de España.

Pero eso cambió en diciembre de 2020, cuando una tercera ola, impulsada por la variante Alpha más contagiosa que había surgido en Inglaterra, tomó por sorpresa a las autoridades regionales. Aunque Valencia se convirtió más tarde en la única parte de España en prohibir los viajes interregionales durante el período navideño, la transmisibilidad de la variante Alpha ya había significado que el virus estaba circulando más de lo que se entendía a partir de las pruebas. Visitantes de otras partes de España y del extranjero habían estado viajando dentro y fuera de este popular destino turístico durante meses de restricciones de distanciamiento social relajadas, con resultados desastrosos. El promedio diario de infecciones registradas en la región aumentó de 1.450 a fines de diciembre a más de 8.000 un mes después, y en ese mismo lapso de tiempo las hospitalizaciones se triplicaron y las muertes diarias se multiplicaron por seis. Aparte de un puñado de áreas en Portugal, La región de Valencia durante 14 días registró la mayor incidencia acumulada de infección en toda Europa.

Este resultó ser un momento decisivo para el reconocimiento más amplio del trabajo de Oliver. Berenguer dice que durante algunas de las primeras reuniones con otros expertos, en la primavera de 2020, siempre se había sentido “muy tenso” cada vez que Oliver presentaba los hallazgos de su equipo. Los epidemiólogos, dice Berenguer, “no fueron realmente muy amables, fueron extremadamente escépticos” de las predicciones construidas sobre fuentes de datos tan poco ortodoxas. 

Pero en diciembre de 2020, un episodio específico ilustró cómo ese escepticismo comenzaba a disminuir, ya que los diversos modelos del equipo arrojaban predicciones que demostraron ser notablemente precisas una y otra vez. Los gobiernos regionales españoles disfrutan de una autonomía significativa, pero carecen de la autoridad para instituir toques de queda unilaterales a los ciudadanos, lo que requiere la aprobación de un magistrado. Hasta finales de 2020, el jefe de epidemiología del departamento de salud de Valencia siempre se había encargado de defender este tipo de intervenciones. Pero un día de diciembre, un funcionario del departamento de salud llamó a Berenguer antes de acudir al juez para obtener su aprobación, insistiendo en que sus datos podrían ayudar a defender el cierre de restaurantes. Cuando el juez vio esos datos, aprobó el toque de queda y el cierre de restaurantes, y lo ha hecho en todas las ocasiones desde entonces. “Es asombroso”, dice Berenguer. “Somos una de las únicas regiones que realmente obtendrá ese pase, porque estamos haciendo un gran esfuerzo, en evidencia de que lo necesitábamos”. Esa fue, dice, la última vez que los principales epidemiólogos de la región expresaron algún escepticismo en las reuniones sobre el uso de fuentes innovadoras de datos.

En este punto, el ecléctico grupo de investigación de Oliver se sentía cada vez más seguro de lo que había logrado. El equipo acordó participar en un concurso de tecnología patrocinado por la organización sin fines de lucro XPRIZE, que estaba ofreciendo $ 500,000 por un sistema de inteligencia artificial capaz de desarrollar automáticamente un plan de respuesta a una pandemia. La competencia, que enfrentaría los esfuerzos de Valencia con las principales instituciones académicas mundiales, se redujo a la construcción de dos herramientas: un “predictor”, capaz de pronosticar el número de infecciones en docenas de países diferentes, y un “prescriptor”, ideando enfoques detallados aunque hipotéticos para contener COVID-19. Para el predictor, el equipo de Oliver se basó en muchas de sus técnicas existentes, pero las expandió al introducir datos de infecciones en todo el mundo que habían sido registrados y recopilados por investigadores de la Universidad Johns Hopkins. permitiendo pronósticos de números de casos para 236 regiones y naciones separadas hasta con seis meses de anticipación. También tomaron en cuenta los datos de la Universidad de Oxford que les permitieron ajustar las cifras según las intervenciones del gobierno, como los mandatos de distanciamiento social, el cierre de escuelas y los turnos alternos de fábrica.

En medio de la tercera ola de la pandemia en España, el sistema predictivo desarrollado para el XPRIZE también se puso en uso en el escenario real de Valencia. La herramienta pronostica un pico local de infecciones a fines de enero. Las autoridades sanitarias de la región estaban preocupadas por la capacidad de camas de la UCI, por lo que era fundamental comprender el momento y la escala de este pico. “Realmente esperábamos que el modelo fuera el correcto”, dice Oliver. El modelo no solo predijo con precisión la escala del aumento repentino de enero, dentro de menos de un punto porcentual del número total de casos, sino que también pronosticó correctamente el día preciso en que esos números de infecciones comenzarían a disminuir. Las estimaciones permitieron que la capacidad hospitalaria se recuperara en el tiempo y significó que las medidas de distanciamiento social se reintrodujeron con suficiente antelación. Después de ese éxito, Los tomadores de decisiones políticas finalmente entendieron el poder del sistema que Oliver y su equipo habían construido. “Realmente confiaron en el modelo que construimos para el XPRIZE”, dice Oliver. “Ahora podemos hacer tantas cosas. Está en la agenda política ”.

Pero es la segunda fase del concurso XPRIZE, el desarrollo de un “prescriptor”, la que puede resultar más importante para el futuro de la IA como herramienta de formulación de políticas. Como base, el equipo calculó una serie de puntos de datos para trazar un gráfico de línea curva, donde el eje y medía el rigor de varias intervenciones gubernamentales y el eje x marcaba el número total de casos, hospitalizaciones o muertes. El área debajo de la línea representaba el rango de combinaciones poco realistas, donde las reglas eran demasiado estrictas para ser ejecutadas o las tasas de mortalidad demasiado altas para ser aceptables. En cambio, una solución óptima para un gobierno hipotético dado estaría en algún lugar a lo largo de la línea curva.

El análisis de la Universidad de Oxford muestra que, en cualquier país, en un día determinado, hay casi ocho millones de variables que se pueden modificar, desde cierres totales o parciales de escuelas, cambios en los horarios de apertura de las tiendas minoristas y una amplia gama de retornos de oficinas. políticas. Oliver y sus colegas crearon un modelo que en un momento dado elegiría solo diez intervenciones que conducen a la “compensación óptima”, manteniendo tanto los costos como el recuento de casos en un mínimo aceptable. La premisa básica, dice Oliver, era “pones las cosas en el sistema y luego te dice qué hacer”.

Con el tiempo, es posible que sea necesario eliminar algunas opciones de intervención y agregar otras para adaptarse a una pandemia en evolución. Alberto Conejero, uno de los colaboradores más cercanos de Oliver y profesor de matemáticas aplicadas en la Universidad Politécnica de Alicante, dice que este es un proceso diabólicamente difícil. Pero, si se hace bien, este modelo podría ser útil en contextos futuros no pandémicos. En la agricultura, por ejemplo, donde los agricultores tienen que equilibrar la eficacia de los plaguicidas con sus efectos nocivos sobre la salud humana. “Descubres que no existe una mejor decisión única y siempre debes mantener un equilibrio entre las decisiones”, dice Conejero. Este enfoque, continúa, podría proporcionar una hoja de ruta algorítmica que muestre a los políticos cómo actuar en el mejor interés de la economía, la sociedad y la población en general.

A Escolano le gusta describir la entrada como “su realidad” y la salida como “cuál es la mejor decisión a tomar”. Pero dice que hay aún más complejidades que deben tenerse en cuenta, y para las cuales los humanos pueden estar mejor calificados para juzgar que una IA. El costo social de algunas medidas en una pandemia, como el cierre de escuelas, puede parecer mucho más alto para los participantes humanos en un sistema, por muy efectivas que sean para reducir el número de casos. En última instancia, dice, los parámetros de los costos sociales o económicos aceptables deben ser decididos por los políticos.

Para Oliver, que ha pasado una carrera centrada en este tipo de problemas, este modelo representa una especie de Santo Grial, porque podría sentar las bases para optimizar las decisiones de política pública en todo el gobierno. Su equipo ganó el concurso XPRIZE , y el artículo que coescribieron en el que describía su trabajo ganó posteriormente el máximo galardón en la conferencia académica más prestigiosa de Europa sobre aprendizaje automático, la ECML PKDD.

El equipo sigue centrados en el lanzamiento de la vacuna en la región de Valencia, que tiene una de las poblaciones más vacunadas del mundo, con un porcentaje más alto de adultos inoculados, por encima del 90 por ciento, que en los EE. UU. Y el Reino Unido. Las encuestas ciudadanas han continuado y encontraron que el 93 por ciento de las mujeres y el 90 por ciento de los hombres que respondieron expresaron su disposición a ser golpeados.

Gracias a su experiencia durante los últimos 18 meses, los investigadores ahora tienen un poderoso predictor que ha sido probado en la carretera durante una época de tensión sin precedentes y que sigue utilizándose en toda Valencia. También han creado un sistema que puede sugerir una pequeña cantidad de políticas o intervenciones específicas y efectivas relacionadas con la pandemia que un gobierno puede realizar. En el futuro, esto podría reutilizarse para otras áreas de políticas, pero ahora mismo, en cualquiera de los cientos de regiones o países de todo el mundo, podría generar la menor cantidad de infecciones dentro de los límites presupuestarios designados. En última instancia, dice Escolano, después de todos los miles de millones que se han gastado en intervenciones inútiles durante los últimos 18 meses, la rentabilidad debería importar, tanto para los ciudadanos que pagan impuestos como para los gobiernos que los gastan.