Sí, DeepMind procesa los números, pero ¿es realmente una fórmula mágica? | John Naughton

TEl desarrollo más interesante de la semana no tuvo nada que ver con que Facebook o incluso Google perdieran su apelación contra una multa de 2.400 millones de euros de la Comisión Europea por abusar de su monopolio de búsqueda en detrimento de los competidores de su servicio de compras. El problema más importante fue que DeepMind, una rama de Google con sede en Londres (o, para ser precisos, su compañía matriz, Alphabet) se estaba moviendo hacia el negocio farmacéutico a través de una nueva compañía llamada Isomorphic Labs, cuyo objetivo se describe ampliamente como » reinventar todo el proceso de descubrimiento de fármacos desde los primeros principios con un enfoque de IA primero ”.

Dado que están interesados ​​en los primeros principios, primero aclaremos esa referencia a la IA. Lo que significa en este contexto no es nada que sea artificialmente inteligente, sino simplemente aprendizaje automático, una tecnología de la que DeepMind es un maestro reconocido. La IA se ha convertido en un ejemplo clásico del lenguaje orwelliano adoptado por la industria tecnológica para desinfectar una tecnología que consume mucha energía y que devora datos y que, como la mayoría de las cosas digitales, tiene aplicaciones tanto socialmente útiles como distópicas.

Dicho esto, esta nueva empresa de DeepMind parece más en el lado socialmente útil de la ecuación. Esto se debe a que sus investigadores han descubierto que su tecnología podría desempeñar un papel importante en la solución de un problema central en biología, el plegamiento de proteínas.

Las proteínas son moléculas grandes y complejas que realizan la mayor parte del trabajo pesado en los organismos vivos. Casi todas las funciones corporales (contraer los músculos, sentir la luz, digerir los alimentos, hacer funcionar el sistema inmunológico, lo que sea) se basan en las proteínas. Y lo que puede hacer una proteína determinada depende de su estructura tridimensional.


Recomendado: ¿Qué es el Big data?.


El problema es que, aunque ahora podemos leer la secuencia genética de una proteína, eso no nos dice cómo se plegará en la forma 3D que determina su función. Y predecir la estructura a partir de la secuencia es un problema muy difícil. Ya en 1969, el biólogo molecular estadounidense Cyrus Levinthal estimó que el número de plegamientos posibles de una proteína bastante típica podría ser de 10 elevado a 300, lo que, si se pasara por cada una de las posibilidades, tomaría más tiempo que el edad actual del universo para desentrañar!

Cada dos años, la comunidad de investigación centrada en el problema del plegamiento realiza una competencia por la predicción computacional de la estructura de las proteínas. En 2018, el software de aprendizaje automático Alphafold de DeepMind entró en la refriega y, inesperadamente, se adelantó a otros equipos. En noviembre pasado, incluso los normalmente sobrios Naturaleza lo describió como «muy superior a los 100 equipos de investigación que participan en la competencia de 2020».

Así que es fácil ver por qué DeepMind pensó que estaba en lo cierto. Por un lado, poder determinar la estructura de las proteínas rápidamente podría ser de gran ayuda para el diagnóstico y la atención médica. (Proteína mal plegado se cree que juega un papel importante en la enfermedad de Parkinson, por ejemplo). Por otro lado, por muy amplia que sea la industria de la tecnología, la atención médica es mucho más grande y si Alphabet está pensando en qué hacer ahora que ha resuelto la búsqueda, entonces Isomorphic Los laboratorios pueden resultar una inversión inteligente. (También podría aliviar las dudas de algunos fanáticos de DeepMind sobre trabajar para un imperio capitalista de vigilancia).

Para los evangelistas del aprendizaje automático, la última incursión de DeepMind en la biología molecular será aclamada como una prueba más de que las formas convencionales de hacer ciencia (formular hipótesis, idear formas de probarlas, recopilar datos o hacer experimentos, revisión por pares, etc.) son obsoletas. Si eso es lo que piensan algunos entusiastas, entonces no han entendido ni el aprendizaje automático ni la ciencia. Lo que DeepMind ha demostrado brillantemente es que la combinación de algoritmos inteligentes y computación de fuerza bruta es buena en algunas tareas bastante especializadas, como los juegos, donde existen reglas conocidas y criterios claros para el éxito. O, más concretamente, predecir estructuras de proteínas. Queda por ver si la combinación es tan eficaz en dominios menos estructurados.

Eso no significa que la tecnología no sea útil en muchos dominios científicos. En lo que es particularmente bueno es en extraer patrones de colosales tesoros de datos, razón por la cual, por ejemplo, a los astrofísicos y físicos de partículas les encanta. Es por eso que muchos observadores lo ven como una herramienta útil para descubrimiento. El aprendizaje automático proporciona una forma de encontrar correlaciones, a veces extrañas e inesperadas, en montañas de datos, como, por ejemplo, cuando Walmart descubrió que los clientes estadounidenses que se abastecían antes de las advertencias de huracán tendían a comprar tartas de refresco, así como los suministros de precaución habituales.

Correlaciones como esa pueden ser útiles para un minorista de supermercados, pero la correlación, como todo estudiante de matemáticas de GCSE sabe, no es lo mismo que causalidad. Las tasas de divorcio en Maine están estrechamente relacionadas con el consumo per cápita de margarina en ese delicioso estado. Asimismo, el número de personas ahogadas por caer en piscinas sigue de cerca el número de películas en las que ha aparecido el actor Nicolas Cage. Correlaciones como estas pueden resultar divertidas o sorprendentes, pero no contribuyen en nada a nuestra comprensión. Para eso necesitamos saber cómo es un efecto causado por otra cosa. Necesitamos un método científico antiguo, no una elegante red neuronal.

Lo que he estado leyendo

Sobrecarga de anuncios
La singularidad está aquí es un ensayo elocuente de Ayad Akhtar en el atlántico sobre lo que nos está haciendo el capitalismo de vigilancia.

Streetwise
Memory Lanes: el mapa de nuestras vidas de Google es una característica encantadora de Sirin Kale en el Observador revista sobre recuerdos provocados por ver a personas del pasado al navegar por Google Streetview.

Listos para despegar
Mario Vargas Llosa: Cómo perdí el miedo a volar es un ensayo fascinante en el sitio web FSG Work in Progress.