Jessica Kissinger nunca se propuso hacer bases de datos. Desde que era una niña quería ser bióloga.
Hoy, el profesor de la Universidad de Georgia no solo estudia patógenos mortales como la malaria y el Cryptosporidium (un parásito transmitido por el agua), sino que también es una fuerza impulsora detrás de colaboraciones innovadoras en todo el mundo en bases de datos novedosas. Durante su tiempo en UGA, ha recibido casi $40 millones en subvenciones y contratos federales y privados.
Estas bases de datos pueden analizar grandes cantidades de información biológica a la velocidad de la luz y revelar patrones importantes que allanan el camino para nuevos enfoques de flagelos como la Leishmania (común en los trópicos, subtrópicos y el sur de Europa), la toxoplasmosis (una enfermedad sistémica debida a uno de los los parásitos más comunes del mundo) y la Fiebre del Valle (un hongo que nace en el viento y que puede causar infecciones pulmonares y sistémicas). Se pueden desarrollar nuevos objetivos de fármacos y vacunas, así como nuevos conocimientos sobre patógenos potencialmente mortales.
«Combatir infecciones y desarrollar nuevos objetivos de fármacos y vacunas requiere un conocimiento detallado de un patógeno y cómo funciona», explicó Kissinger, profesor de investigación distinguido en el Departamento de Genética, el Instituto de Bioinformática y el Centro de Enfermedades Tropicales y Globales Emergentes de la UGA.
Y, al igual que las búsquedas en Internet, las bases de datos son todas gratuitas. Kissinger dijo que es probable que las compañías farmacéuticas estén extrayendo parte de la información en su búsqueda para descubrir nuevos objetivos terapéuticos.
“No nos dicen en qué están trabajando”, dijo. “Una base de datos en sí misma no produce una cura. Sin embargo, una base de datos puede eliminar la mayoría de las barreras para el análisis de los datos existentes”.
Big Data allana el camino para grandes avances en la ciencia
Una vez tomó una década entera secuenciar un solo genoma, y el costo fue de muchos millones. Hoy, los investigadores pueden secuenciar un genoma en una sola tarde por unos pocos miles de dólares, transformando el campo de la genómica. Asombrosos avances similares han reformado otras especialidades «ómicas», como la proteómica (estudio de las proteínas), la metabolómica (estudio del metabolismo), la transcriptómica (estudio del ARN) y la epigenómica (la influencia del medio ambiente en la función de los genes). Estos avances marcan la era del “Big Data” en biología.
“El poder que desata el big data es fenomenal”, dijo Kissinger, “y es un momento muy emocionante en la historia, con los principales financiadores y visionarios de todo el mundo formando consorcios para crear una especie de universo de datos ideal”. Como exploradores que se adentran en un nuevo mundo, harán descubrimientos que ahora solo imaginamos.
Creación de una base de datos sobre malaria
Las innovaciones de Kissinger comenzaron hace más de 23 años, cuando era investigadora postdoctoral en la Universidad de Pensilvania y estudiaba un parásito unicelular llamado Toxoplasma gondii. El parásito comparte algunas características importantes con el patógeno de la malaria, cuyo genoma estaba en proceso de secuenciación.
“Reuní datos del genoma de todo el mundo sobre Plasmodium (el agente causante de la malaria), realicé análisis y los puse en un sitio web, para poder estudiar los genes que podría compartir con Toxoplasma”, recordó. «Resulta que nadie había hecho que los datos de Plasmodium estuvieran disponibles para realizar búsquedas antes».
Pronto, ella y su asesor, David Roos, recibieron una subvención de un millón de dólares para establecer formalmente una base de datos sobre la malaria, PlasmoDB, y desde su lanzamiento en 1999 ha crecido para incluir patógenos adicionales y ha recibido financiamiento continuo del NIH, el más reciente para hasta a $ 38,4 millones para mantener lo que ahora se ha convertido en la base de conocimientos de recursos informáticos de patógenos, vectores y huéspedes eucariotas (VEuPathDB), que cubre 14 patógenos diferentes, así como las respuestas del huésped a las infecciones. Esta completa base de datos es un recurso centralizado e integrado para la extracción de datos sobre más de 500 organismos.
En conjunto, las bases de datos contienen más de nueve terabytes (9000 gigabytes) de datos, y la Sociedad Británica de Parasitología las comparó con una Wikipedia para parasitología molecular, que señaló en 2006: “¡No sabemos qué haríamos sin ella! ”
Cada mes, VEuPathDB recibe más de 11 millones de visitas de un promedio de 36 000 visitantes únicos en más de 100 países, incluidos India, Brasil y Kenia. Una base de datos relacionada sobre vectores de enfermedades (como las garrapatas que transmiten la enfermedad de Lyme) se fusionó recientemente en VEuPathDB. La fusión amplió cada recurso y permite a los investigadores explorar mejor los datos sobre vectores como garrapatas y mosquitos y los patógenos que transmiten.
Herramientas poderosas son clave para analizar datos
Las bases de datos no son solo cadenas de números o palabras. Permiten visualizaciones e interfaces gráficas. Ya están surgiendo investigaciones que pueden ayudar a desviar el desarrollo de vacunas y medicamentos de las proteínas que comparten los huéspedes y los patógenos, para proteger la célula. Los científicos que utilizan las bases de datos han descubierto proteínas que reducen la malaria grave y otras proteínas que protegen a los parásitos de la malaria de la respuesta a la fiebre humana. También han encontrado proteínas que ayudan Toxoplasma penetrar en las células huésped.
En un solo año una media de 200 publicaciones al mes citan VEuPathDB, y hasta la fecha ya se han producido 24.000 citas en total. A continuación: aplicaciones preparadas para la nube e integración mejorada con otras bases de datos. Estas bases de datos “se han convertido en plataformas de acceso y extracción de datos esenciales para la investigación genómica de hongos y parásitos”, dijo el microbiólogo y patólogo de plantas Jason Stajich de la Universidad de California en Riverside.
“Sin herramientas poderosas y fáciles de usar para analizarlo, el Big Data es más una maldición que una bendición”, explicó John Boothroyd, inmunólogo y microbiólogo de la Facultad de Medicina de la Universidad de Stanford. “VEuPathDB es una herramienta de este tipo y le debemos a Jessica Kissinger y sus colegas un enorme agradecimiento por sus esfuerzos incansables y desinteresados para concebir primero y luego mejorar continuamente este recurso absolutamente esencial”.
Las subvenciones para proyectos relacionados provienen de una amplia gama de organizaciones, entre ellas la Fundación Bill y Melinda Gates, la Fundación Sloan y la Organización Mundial de la Salud. Uno de esos proyectos, llamado ClinEpiDB, alberga un estudio multicéntrico que contiene datos de más de 22 000 niños de siete sitios diferentes en el sur de Asia y África. Este estudio es el más grande jamás realizado para investigar las causas de la diarrea en niños en países de bajos a medianos ingresos. Otros usos de ClinEpiDB incluyen nuevos datos sobre signos ocultos de transmisión de malaria en áreas donde la incidencia está disminuyendo, o cómo la lactancia materna protege a los bebés de infecciones comunes.
La base de datos VEuPathDB sería suficiente para asegurar la reputación de Kissinger en las ciencias biológicas, pero ella no se ha detenido ahí. En la Universidad de Georgia, fue miembro fundador del Instituto de Bioinformática y se desempeñó como su directora de 2011 a 2109. La misión del Instituto es facilitar la investigación interdisciplinaria de vanguardia en biología computacional, y el programa ofrece maestrías y doctorados. . Ella es una investigadora clave que ayuda a asociarse con un centro nacional para la investigación de enfermedades infecciosas al vincularse con la Universidad de Emory en Atlanta. Las dos instituciones tienen subvenciones por un total de más de $ 45 millones para trabajar en todo, desde la tuberculosis hasta el VIH y la malaria.
“Estas bases de datos son un éxito más allá de mis sueños más salvajes”, dijo Kissinger. “Están hechos por biólogos para otros biólogos y abordan una necesidad de la vida real”.