El público en general utiliza el aprendizaje automático (ML) y la ciencia de datos casi indistintamente para el tipo de brujería mística de datos de la que se cree que depende gran parte del futuro. Pero son dos cosas diferentes, entrelazadas. Analicemos los datos sobre ciencia de datos y aprendizaje automático para tener una idea más clara de qué es qué.
Definiciones.
La ciencia de datos es un campo general, del cual el aprendizaje automático es técnicamente solo una parte. Si bien los dos a menudo trabajan en armonía, solo uno puede existir independientemente del otro. La ciencia de datos, como campo más amplio, puede existir sin el aprendizaje automático. El aprendizaje automático, como parte de la ciencia de datos, no puede existir sin la ciencia de datos.
La ciencia de datos determina los procesos, sistemas y herramientas que se necesitan para convertir los datos recopilados en información procesable. Esos conocimientos pueden ser, y cada vez más, son utilizados por una amplia gama de industrias, desde infraestructura hasta diseño de productos, marketing y proyectos gubernamentales.
Los científicos de datos utilizan una amplia gama de métodos, algoritmos, sistemas y herramientas, según lo consideren apropiado, para traducir datos, tanto estructurados como no estructurados, en resultados significativos y presentables que luego se utilizan para guiar o desarrollar cualquier proyecto en el que estén trabajando. .
El aprendizaje automático, por otro lado, utiliza datos, generalmente proporcionados por otros científicos de datos, en inteligencia artificial (IA), lo que le da a las máquinas… la capacidad de aprender… de la manera más cercana posible a los seres humanos, pero generalmente mucho más rápido y con mayor precisión. La IA está «entrenada» en cómo «pensar» mediante el uso repetido de datos en una serie de algoritmos diseñados para permitir que la máquina tome decisiones «más inteligentes» con el tiempo, por lo que lo llamamos «aprendizaje automático».
Disciplinas.
Existen claras diferencias entre los discípulos de la ciencia de datos y el ML, pero también hay una superposición considerable. Es probable que los científicos de datos y los especialistas en aprendizaje automático hablen mucho del mismo «lenguaje» en términos de sus trabajos y los resultados requeridos de ellos. Todos en el campo necesitarán habilidades matemáticas sólidas y rápidas, y vivir y respirar estadísticas y probabilidades.
Los científicos de datos también serán fuertes en la visualización de datos y la disputa de datos, ya que a menudo tratarán con volúmenes significativos de datos y tratarán de domar las locuras salvajes y agitadas de los datos a gran escala en resultados significativos y procesables, como para ejemplo puede ser entendido por los miembros de la junta directiva de una empresa sin semanas de terapia adicional.
Es posible que los especialistas en ML hayan sido científicos de datos generales en algún momento de su carrera, aunque en la actualidad existen trayectorias profesionales específicas y aisladas que se centran únicamente en el aprendizaje automático. Pero además de las habilidades matemáticas y el dominio de la probabilidad, es probable que sean competentes en algunos lenguajes de codificación en particular que los ayuden en su día de aprendizaje automático. Cada vez que busca a un especialista en aprendizaje automático, probablemente esté viendo a alguien que tiene algunas habilidades de alto nivel en Python, Java y SQL en su haber, porque conocer esos lenguajes es un atajo para entrenar con precisión una IA para hacer el aprendizaje automático que desea que haga en función de los datos que le proporciona.
Es poco probable que los científicos de datos se queden atrás en el campo de la codificación, y bien pueden tener algunas habilidades sólidas de Python y SQL para implementar en la búsqueda de significado de sus datos, junto con algo de R y algo de SAS. Pero los especialistas en aprendizaje automático vivirán y respirarán su Python en su trabajo diario.
Practicidades.
El aprendizaje automático es una consecuencia de la ciencia de datos, pero ahora está encontrando otras vías propias, lejos del cuerpo principal de la ciencia de datos. Está más o menos a punto de convertirse en algo completamente distinto, al menos en lo que respecta a la contratación y las disciplinas.
Si tiene una gran cantidad de datos y quiere que signifique algo para impulsar, por ejemplo, el desarrollo de su producto hacia un resultado único, único y definitivo, necesita un equipo de científicos de datos.
Si desea enseñarle a una máquina a producir resultados cada vez más adecuados a un problema a lo largo del tiempo alimentándola con datos de muestra, como por ejemplo un sistema para encontrar a los mejores candidatos para un puesto en función de una descripción del puesto y un conjunto de habilidades, está va a necesitar un equipo de especialistas en ML.
La principal diferencia entre los dos roles de trabajo, además de la naturaleza fundamental de cómo abordan los problemas, es que los científicos de datos generales serán asignados para resolver un problema en particular, una vez. Los especialistas en aprendizaje automático entregarán una máquina, o más probablemente un conjunto de algoritmos o programas que puedan instruir una máquina: para entregar resultados de manera continua y para mejorar en el ajuste de los resultados a las demandas del cliente cuantas más veces lo alimente con datos y genere resultados. Investigaciones recientes afirman que ML podría incluso usarse para predecir desastres raros.
El futuro.
Ambos roles son parte del frente emergente de roles en tecnología que se están generando mediante la exploración de lo que los conocimientos de datos pueden aportar al mundo comercial y la evolución de la IA y el aprendizaje automático en beneficios comerciales prácticos. Y ambos son potencialmente extremadamente gratificantes. A partir de 2019, ocuparon los lugares n. ° 1 y n. ° 3 respectivamente (con el especialista en aprendizaje automático en la cima) en Noticias de EE. UU.‘encuesta de los mejores trabajos en tecnología.
Originalmente, los científicos de datos generales tendían a ser los más demandados de los dos, y los especialistas en aprendizaje automático ocupaban un nicho dentro de la ciencia de datos. Pero cada vez más, especialmente en la época en que las plataformas de redes sociales viven y mueren en función de sus algoritmos y se descubren cada vez más razones para utilizar el aprendizaje automático de formas innovadoras dentro de la comunidad empresarial en general, los ingenieros de aprendizaje automático (que a menudo es una agrupación que incluye ingenieros en la nube) se están convirtiendo en un recurso necesario en todo el mundo empresarial.
¿Aprendizaje automático versus ciencia de datos? Eso es como comparar naranjas y clementinas: pueden parecer muy similares a simple vista, pero existen claras diferencias, y cuando necesita una u otra, todas son importantes.
Lo mejor de todo es que el mundo de la tecnología es lo suficientemente grande como para acomodarlos a ambos.