¿Se ha respondido ya una de las preguntas más importantes de la ciencia? Por los titulares se podría pensar que sí. Porque se ha encontrado el «santo grial» de la biología. Para otros la extinción planetaria podría ser evitada. En la superficie, las noticias parecían bastante mundanas. La empresa de inteligencia artificial de Google, DeepMind, ganó un concurso internacional en el que se pedía a los participantes que predigan cómo se pliegan las proteínas en tres dimensiones dadas sólo las secuencias de sus enlaces químicos, o aminoácidos.
Establecido en 1994, el progreso en la carrera de «Evaluación Crítica de la Predicción de la Estructura de la Proteína» (CASP) casi se había detenido. Muchos en el campo habían perdido la esperanza de que vivirían para ver una solución. Sin embargo, en 2018 DeepMind había ganado las «Olimpiadas de la proteína» por alguna distancia. Este año su software AlphaFold2 se impuso a la oposición. Aunque fue un gran salto para el CASP, parecía un pequeño paso para la humanidad. DeepMind entrenó una red neuronal en bases de datos de estructura de proteínas para aprender cómo son las proteínas. Lo hizo aprendiendo rápidamente qué adaptaciones evolutivas se habían producido durante milenios y utilizando esos conocimientos en sus conjeturas.
Las proteínas son los bloques de construcción clave de la vida, íntimamente involucradas en cada proceso biológico. El cáncer se debe a una sobreproducción de proteínas. El metabolismo del cuerpo está regulado por una proteína, la insulina. Las proteínas humanas doblan a menudo cientos de aminoácidos en un sorprendente número de formas: alrededor de un gogol al cubo o 10 a la potencia de 300. La forma determina si una proteína catalizará una reacción química, se convertirá en el andamiaje de un organismo o transportará moléculas dentro y fuera de la célula. Las proteínas mal formadas causan muchas enfermedades mortales y juegan un papel en el envejecimiento.
Puede que no sea posible prever los beneficios del trabajo de DeepMind hoy en día. Las drogas funcionan adhiriendo una proteína en un lugar determinado, alterando o inhabilitando así su función. Es la estructura tridimensional de la proteína de punta del coronavirus la que ve que se une firmemente a los receptores de nuestras narices. Conocer la forma de una proteína puede permitir a los científicos en el futuro identificar tales sitios de unión y facilitar la síntesis terapéutica desde cero. Pero hay un largo camino por recorrer ya que muchas interacciones en el cuerpo siguen siendo enigmas sin soluciones. DeepMind admite que su código no puede manejar complejos de proteínas que trabajan juntas para llevar a cabo funciones clave. En resumen, el problema del plegamiento de proteínas está lejos de ser resuelto.
El logro de DeepMind responde a una gran pregunta científica pero plantea otras más fundamentales para la sociedad. Parte de una empresa con fines de lucro, DeepMind paga grandes salarios por el escaso talento de la IA. Su noticia pionera fue anunciada en un comunicado de prensa de la compañía. Todavía no ha presentado un documento que describa su trabajo a una revista revisada por pares, aunque este año ha publicado uno en su entrada en el CASP 2018. Una idea simple sustenta la ciencia: los resultados deben estar siempre sujetos a los desafíos de los experimentos. Las empresas comerciales pueden querer que se confíe en ellas más que que se las examine.
Si hay un cambio de paradigma en la biología que DeepMind representa es el impacto de la inteligencia artificial en la biología. En 2020, se cree que habrá 21.000 artículos científicos que involucren métodos de IA en esta rama de la ciencia – y esto está creciendo a un 50% anual. También está dominada por los gigantes de la tecnología cuyo código es su propiedad intelectual, lo que la hace particularmente opaca. Sólo el 25% de los trabajos de IA publican su código. DeepMind, dicen los expertos, regularmente no lo hace. Esto perjudica la responsabilidad y la reproducibilidad y en última instancia puede obstaculizar el progreso. Hay intentos continuos de compartir datos de propiedad, respetando su naturaleza altamente confidencial. Sería mejor que la industria adoptara una actitud más abierta.
La ciencia ha progresado tradicionalmente distribuyendo libremente el conocimiento. La preocupación subyacente es que DeepMind, como su rival OpenAI, puede optar por comercializar su modelo de aprendizaje profundo en lugar de hacerlo disponible libremente. Algunos argumentan que el precio no es un problema y que AlphaFold2 es barato. Los avances de DeepMind descansan en parte en los avances respaldados por el Estado, desde la visión evolutiva del bioinformático español Alfonso Valencia hasta el trabajo computacional de científicos como David Jones de la UCL. Sería extraño que en los próximos años los investigadores universitarios utilizaran el dinero del gobierno para pagar a DeepMind por un sistema construido sobre conocimientos financiados por el gobierno. Al universo no le faltan misterios. Su descubrimiento debería ser celebrado y dedicado en gran medida al bien público en lugar de a la búsqueda de beneficios.