euskaraespañol

El grupo de investigación Ixa aplica la inteligencia artificial contra el COVID-19

El grupo de investigación Ixa ha sido galardonado en la competición de inteligencia artificial fomentado por el gobierno de Estados Unidos en torno a la pandemia

  • Noticias

Fecha de primera publicación: 11/05/2020

Imagen
Foto archivo del grupo Ixa. Foto: Nagore Iraola. UPV/EHU

La competición CORD-19 (COVID-19 Open Research Dataset Challenge) ha sido organizado por varias organizaciones tales como Allen Institute for AI, Chan Zuckerberg Initiative, Georgetown University, Microsoft Research, National Institutes of Health y Office of Science and Technology Policy de la Casa Blanca. La organización ha puesto a disposición de la comunidad de investigación mundial alrededor de 60.000 artículos científicos sobre COVID-19, SARS-CoV-2 y otros coronavirus. Paralelamente, hizo un llamamiento a la acción a los investigadores de inteligencia artificial para que aplicaran los recientes avances en el procesamiento del lenguaje natural, con el fin de ayudar a los científicos que luchan contra la enfermedad COVID-19 a encontrar información necesaria en la literatura científica.

En la primera fase de la competición ha contado con cientos de participantes. Se han entregado 10 premios, uno de los cuales ha ganado el sistema desarrollado en el grupo Ixa del centro HiTZ. En el desarrollo del sistema han participado los investigadores de la Universidad del País Vasco Arantxa Otegi y Jon Ander Campos y los profesores Eneko Agirre y Aitor Soroa. El sistema desarrollado busca respuestas a las preguntas de alta prioridad de los expertos relacionados con la enfermedad COVID-19 y el virus SARS-CoV-2 analizando los mencionados artículos científicos. Este sistema es útil para encontrar respuestas a cuestiones como, por ejemplo, la historia del coronavirus, la transmisión y diagnóstico del virus, las medidas de prevención en el contacto entre seres humanos y animales y las lecciones de estudios epidemiológicos previos. El resultado del sistema ha sido evaluado por un grupo de expertos de la NIH de Estados Unidos y ha sido seleccionado como el sistema que mejor ha respondido al cuestionario sobre el tema: “What do we know about diagnostics and surveillance?” (¿Qué sabemos sobre diagnóstico y vigilancia?). El tema incluye preguntas concretas como “Is the use of screening of neutralizing antibodies such as ELISAs valid for early detection of disease?” a lo que el sistema responde, entre otras respuestas, “Serologic assays are not useful for early diagnosis as igg antibodies do not appear for 7 - 10 days after onset of symptoms” basado en el artículo sobre “SARS: future research and vaccine” publicado en la revista “Paediatric Respiratory Reviews” el 31/12/2004. Las preguntas y las respuestas dadas por el sistema pueden verse aquí.

Este premio -comenta Jon Ander Campos, investigador pre-doctoral-, supone un reconocimiento a la labor desarrollada dentro del grupo Ixa en el uso de la inteligencia artificial para el tratamiento de lenguaje. Eneko Agirre, profesor, añade que es además una prueba de la importancia que tienen los sistemas de procesamiento del lenguaje para hacer frente a la gran cantidad de información que se genera de forma constante. Según Arantxa Otegi, investigadora post-doctoral, el sistema consulta 60.000 artículos, de los que una sexta parte son del 2020, con un ritmo de publicación de artículos sobre el coronavirus de casi 100 artículos por día, sobrepasando la capacidad de lectura de los científicos.

El sistema galardonado se implementó en apenas un mes.  Utiliza tecnologías desarrolladas dentro del grupo que permiten entrenar redes neuronales para que respondan a preguntas planteadas en lenguaje natural y busquen las posibles respuestas en grandes cantidades de documentos. Además, el sistema desarrollado para esta competición es capaz de auto-evaluarse y no responder si no está seguro de que la respuesta es la correcta. Esa es una de las claves de este sistema, comenta Aitor Soroa, profesor, ya que así se disminuye el exceso de información.