Foto de Tara Winstead
Han pasado muchas cosas en la primera mitad de 2023. Ha habido avances significativos en ciencia de datos e inteligencia artificial. Tanto que nos ha costado seguirles el ritmo a todos. Definitivamente podemos decir que la primera mitad de 2023 ha mostrado un progreso rápido que no esperábamos.
Entonces, en lugar de hablar demasiado sobre cómo estas innovaciones nos atraen a todos, hablemos de ellas.
Voy a empezar por lo más obvio. Procesamiento del Lenguaje Natural (PNL). Algo que se estaba construyendo en la oscuridad, y en el año 2023 ha salido a la luz.
Estos avances se probaron en ChatGPT de OpenAI, que cautivó al mundo. Desde su lanzamiento oficial a principios de año, ChatGPT pasó de GPT-4 a GPT-5. Han lanzado complementos para mejorar la vida cotidiana de las personas y flujos de trabajo para científicos de datos e ingenieros de aprendizaje automático.
Y todos sabemos que después del lanzamiento de ChatGPT, Google lanzó Bard AI, que ha demostrado tener éxito entre las personas, las empresas y más. Bard AI ha estado compitiendo con ChatGPT por la mejor posición de chatbot, brindando servicios similares, como mejorar las tareas para los ingenieros de aprendizaje automático.
En medio del lanzamiento de estos chatbots, hemos visto caer de la nada modelos de lenguajes grandes (LLM). La Organización de sistemas de modelos grandes (LMSYS Org), una organización de investigación abierta fundada por estudiantes y profesores de UC Berkeley, creó ChatBot Arena, un punto de referencia de LLM para hacer que los modelos sean más accesibles para todos mediante un método de desarrollo conjunto que utiliza conjuntos de datos abiertos, modelos, sistemas, y herramientas de evaluación.
Entonces, ahora las personas se están acostumbrando a los chatbots que responden preguntas por ellos y hacen que su trabajo y su vida personal sean mucho más fáciles. ¿Qué pasa con los analistas de datos y los especialistas en aprendizaje automático?
Bueno, han estado usando AutoML, una poderosa herramienta para profesionales de datos, como científicos de datos e ingenieros de aprendizaje automático, para automatizar el preprocesamiento de datos, el ajuste de hiperparámetros y realizar tareas complejas como la ingeniería de características. Con los avances en ciencia de datos e IA, naturalmente hemos visto una gran demanda de especialistas en datos e IA. Sin embargo, a medida que el progreso avanza a un ritmo acelerado, estamos viendo una escasez de estos profesionales de IA. Por lo tanto, ser capaz de encontrar formas de explorar, analizar y predecir datos en un proceso automatizado mejorará el éxito de muchas empresas.
No solo podrá liberar tiempo para los especialistas en datos, sino que las organizaciones tendrán más tiempo para expandirse y ser más innovadoras en otras tareas.
Si estuvieras cerca del estallido de chatbots, habrías visto las palabras ‘IA generativa’. La IA generativa es capaz de generar texto, imágenes u otras formas de medios en función de las indicaciones del usuario. Al igual que los avances anteriores, la IA generativa está ayudando a diferentes industrias con tareas para facilitarles la vida.
Tiene la capacidad de producir contenido nuevo, reemplazar tareas repetitivas, trabajar con datos personalizados y generar prácticamente todo lo que quieras. Si la IA generativa es nueva para usted, querrá aprender sobre la difusión estable: es la base detrás de la IA generativa. Si es un científico de datos o un analista de datos, es posible que haya oído hablar de PandasAI, la biblioteca de python de IA generativa; si no, es un conjunto de herramientas de código abierto que integra capacidades de IA generativa en Pandas para un análisis de datos más simple.
Pero con el lanzamiento de estas herramientas y softwares de IA generativa, ¿siguen siendo necesarios los científicos de datos en la era de la IA generativa?
El aprendizaje profundo continúa prosperando. Con los avances recientes en ciencia de datos e inteligencia artificial, se está invirtiendo más tiempo y energía en la investigación de la industria. Como subconjunto del aprendizaje automático relacionado con algoritmos y redes neuronales artificiales, se utiliza ampliamente en tareas como la clasificación de imágenes, la detección de objetos y el reconocimiento facial.
A medida que experimentamos la cuarta revolución industrial, los algoritmos de aprendizaje profundo nos permiten aprender de los datos de la misma manera que lo hacen los humanos. Estamos viendo más autos sin conductor en las carreteras, herramientas de detección de fraude, asistentes virtuales, modelos predictivos de atención médica y más.
2023 ha demostrado mostrar los trabajos del aprendizaje profundo a través de procesos automatizados, robótica, blockchain y varias otras tecnologías.
Con todo esto que está pasando, debes pensar que estas computadoras están bastante cansadas, ¿verdad? Para cumplir con los avances de la IA y la ciencia de datos, las empresas requieren computadoras y sistemas que puedan ayudar a respaldarlas. Edge computing acerca la computación y el almacenamiento de datos a las fuentes de datos. Cuando se trabaja con estos modelos avanzados, la informática perimetral proporciona procesamiento de datos en tiempo real y permite una comunicación fluida entre todos los dispositivos.
Por ejemplo, cuando los LLM se lanzaban cada dos segundos, era obvio que las organizaciones necesitarían sistemas efectivos como la computación perimetral para tener éxito. Google lanzó TPU v4 este año: recursos informáticos que pueden manejar las altas necesidades informáticas del aprendizaje automático y la inteligencia artificial.
Debido a estos avances, vemos que más organizaciones pasan de la nube al perímetro para adaptarse a sus requisitos actuales y futuros.
Mucho ha estado sucediendo, y ha estado sucediendo en un corto período de tiempo. Se está volviendo muy difícil para organizaciones como el gobierno mantenerse al día. Los gobiernos de todo el mundo plantean la pregunta de «¿cómo afectan estas aplicaciones de IA a la economía y la sociedad, y cuáles son las implicaciones?».
La gente está preocupada por el sesgo y la discriminación, la privacidad, la transparencia y la seguridad de estas aplicaciones de inteligencia artificial y ciencia de datos. Entonces, ¿cuáles son los aspectos éticos de la IA y la ciencia de datos, y qué debemos esperar en el futuro?
Ya tenemos la Ley Europea de IA que impulsa un marco que agrupa los sistemas de IA en 4 áreas de riesgo. El CEO de OpenAI, Sam Altman, testificó sobre las preocupaciones y los posibles peligros de la nueva tecnología en un comité del Senado de EE. UU. el martes 16. Aunque se están produciendo muchos avances en un corto período de tiempo, mucha gente está preocupada. Durante los próximos 6 meses, podemos esperar que se aprueben algunas leyes más y que se establezcan reglamentos y marcos.
Si no se ha mantenido al día con la IA y la ciencia de datos en los últimos 6 meses, espero que este artículo le haya proporcionado un desglose rápido de lo que ha estado sucediendo. Será interesante ver en los próximos 6 meses cómo se adoptan estos avances mientras se puede garantizar el uso responsable y ético de estas tecnologías.
nisha aria es científico de datos, escritor técnico independiente y administrador de la comunidad en KDnuggets. Ella está particularmente interesada en proporcionar consejos o tutoriales sobre la carrera de Data Science y conocimiento basado en la teoría sobre Data Science. También desea explorar las diferentes formas en que la Inteligencia Artificial es o puede beneficiar la longevidad de la vida humana. Una estudiante entusiasta que busca ampliar sus conocimientos tecnológicos y sus habilidades de escritura, mientras ayuda a guiar a otros.