Inteligencia artificial, aprendizaje automático, redes neuronales, blockchain, ChatGPT.
¿Qué tienen en común todas estas nuevas herramientas y tecnologías? Funcionan con el mismo combustible: datos, y mucho.
Los algoritmos de aprendizaje automático de Netflix, por ejemplo, aprovechan los datos de usuario enriquecidos no solo para recomendar películas, sino también para decidir qué nuevas películas hacer. El software de reconocimiento facial implementa redes neuronales para aprovechar los datos de píxeles de millones de imágenes. Una cadena de bloques es, en esencia, una gran base de datos, descentralizada entre muchos usuarios. Los algoritmos de IA generativa, como los que se usan para crear ChatGPT, se entrenan en grandes conjuntos de datos de idiomas.
Obtener los datos para impulsar estas tecnologías genera de inmediato desafíos relacionados con el sesgo, la precisión, la privacidad y los derechos de propiedad intelectual. Desde al menos 2006, los líderes tecnológicos y los matemáticos han argumentado que los datos son el nuevo petróleo. De manera similar a cómo el petróleo es un recurso clave para los productos físicos, desde la tela hasta el champú, los datos son un recurso vital para nuestras vidas digitales y también una parte cada vez mayor de nuestras vidas fuera de la pantalla.
En las escuelas K-12, los estudiantes se enfrentan a una avalancha de tecnologías emergentes (cada día llegan nuevos desarrollos) y, sin embargo, todavía estamos enseñando muchas de nuestras materias escolares básicas como si nuestras vidas diarias no cambiaran con estas herramientas.
Desde 2011, los puntajes de las pruebas nacionales de matemáticas de la Evaluación Nacional del Progreso Educativo, o NAEP, cayeron 17 puntos para los estudiantes de octavo grado y 10 puntos para los estudiantes de cuarto grado en análisis de datos, estadísticas y probabilidad.
Aún más preocupante, nuestra alfabetización colectiva en datos ha disminuido en la última década. Desde 2011, los puntajes de las pruebas nacionales de matemáticas de la Evaluación Nacional del Progreso Educativo, o NAEP, cayeron 17 puntos para los estudiantes de octavo grado y 10 puntos para los estudiantes de cuarto grado en el análisis de datos. , estadística y probabilidad. Los efectos de la pandemia fueron solo un factor contribuyente, y las caídas superaron las caídas en otras áreas de contenido.
Los resultados de rendimiento también son muy desproporcionados según la raza y los ingresos, con estudiantes negros detrás de los estudiantes blancos por más de 30 puntos en los conceptos básicos de análisis de datos. Por contexto, algunos investigadores creen que una brecha de solo 10 puntos equivale a un año escolar completo de aprendizaje.
Relacionado: Cómo la tecnología educativa puede empeorar la desigualdad racial
Hay muchas razones para estos desafíos, incluida una combinación de estándares y exámenes estatales obsoletos que incentivan a los maestros a colocar el contenido relacionado con datos al final de sus listas de planes de lecciones.
Como era de esperar, esta falta de priorización aflora en el énfasis del contenido autoinformado por parte de los educadores a nivel nacional, lo que muestra que los planes de lecciones dedicados al análisis de datos y estadísticas constantemente obtienen la menor puntuación en matemáticas y otras materias escolares. Esto no es culpa de los maestros, sino del sistema y de las elecciones sistémicas que hemos hecho hasta la fecha que restringen en gran medida el tiempo de clase.
El resultado es que el rendimiento de los estudiantes se ha movido en la dirección opuesta a la tecnología moderna. Necesitamos revertir esta tendencia, rápidamente.
Varias escuelas y estados de todo el país han estado experimentando con las mejores formas de crear e integrar programas de ciencia de datos para estudiantes de K-12. Los cursos de matemáticas de todo el año que se centran en la ciencia de datos se están poniendo a prueba en Ohio, Virginia y Utah; Se han agregado secuencias de educación técnica y profesional para ciencia de datos en Arkansas y Nebraska; las asignaturas optativas de ciencia de datos amplían los fundamentos de la informática en Georgia; Los planes de lecciones con datos integrados en todas las materias escolares y niveles de grado están apareciendo en las aulas desde la costa hasta el corazón.
Los estudiantes llevarán estas habilidades básicas para la vida a lo largo de cualquier carrera, cualquier situación de la vida y cualquier forma de participación cívica a largo plazo.
Todos estos esfuerzos intentan incorporar el análisis de datos y la tecnología computacional en las materias escolares básicas, con un enfoque en matemáticas, ciencias y estudios sociales. Es importante destacar que complementan pero difieren del enfoque de la comunidad informática K-12, que históricamente se ha centrado en crear una materia escolar independiente. Muchos de estos nuevos programas mejoran lo que un maestro ya sabe y puede expresar sobre sus propias disciplinas, agregando conjuntos de datos y tecnología como una forma de profundizar la comprensión.
A pesar de estos esfuerzos, los programas en ciencia de datos en el nivel K-12 siguen siendo pocos y distantes entre sí. En un análisis reciente de los programas estatales, solo nueve estados obtuvieron una calificación de «A» o «B» por la enseñanza de la ciencia de datos. La mayoría de los estados recibieron una «D» o una «F».
Nuestro país debe hacerlo mejor. Nuestro objetivo principal en K-12 debe ser crear una base sólida en la alfabetización de datos para cada estudiante antes de graduarse de la escuela secundaria. Los estudiantes deben estar equipados con la capacidad de interpretar, trabajar con, analizar y comunicar datos de manera efectiva. Los estudiantes llevarán esas habilidades básicas para la vida a través de cualquier carrera, cualquier situación de la vida y cualquier forma de participación cívica a largo plazo.
El objetivo no es crear un ejército de científicos de datos profesionales recién salidos de la escuela secundaria.. Más bien, es proporcionar a los estudiantes la exposición necesaria a los datos básicos y generar inspiración para que obtengan un título de dos años, cuatro años o de posgrado en estos campos, si así lo desean. El trabajo del curso debe ser desafiante pero accesible: «piso bajo, techo alto». El 51 por ciento de los estudiantes que no completarán ningún título universitario en el futuro cercano aún deben aprender los conceptos básicos e inspirarse para explorar oportunidades de capacitación digital de bajo costo para aprender habilidades técnicas y obtener trabajos gratificantes.
Es importante destacar que los estudiantes han informado que realmente disfrutan de los cursos de ciencia de datos. Una cumbre de la Academia Nacional de Ciencias catalogó recientemente la creciente diversidad de enfoques curriculares del campo, con un tema constante de que la participación de los estudiantes está fuera de serie.
Una profesora de matemáticas nos dijo que en más de 20 años de enseñanza, nunca antes había tenido un estudiante que solicitara una pasantía relacionada con su curso, hasta que enseñó ciencia de datos.
Los estudiantes dejan de preguntarse «¿Por qué tengo que aprender esto?» y en su lugar preguntar: «¿Qué sigue?» Algunos maestros incluso informan que los estudiantes se mueven a través del material más rápido de lo previsto.
Necesitamos actuar rápidamente para brindar estas oportunidades a todos los estudiantes y apoyar a los educadores con los recursos adecuados para enseñar bien la alfabetización de datos y la ciencia. Nuestros estudiantes cuentan con nosotros para ayudarlos a prepararse para un futuro que ya está aquí.
Zarek Drozda es el director de Data Science 4 Everyone, una iniciativa nacional con sede en la Universidad de Chicago.
Esta historia sobre la enseñanza de la ciencia de datos fue producida por El Informe Hechinger, una organización de noticias independiente sin fines de lucro centrada en la desigualdad y la innovación en la educación. Matricularse en Boletín de Hechinger.