chica amigaun emprendedor en serie, es el CEO y cofundador de SQream.
Los analistas líderes están haciendo estimaciones de que en cinco años, el 50 % de los datos estructurados y semiestructurados estarán en la nube y serán procesados por proveedores de nube de datos como GCP, Azure y otros. El resto será en las instalaciones.
Por otro lado, el CEO de AWS, Andy Jassy, fue citado al menos dos veces diciendo: «Solo el 4 % de las empresas están en la nube» y «la nube representa menos del 5 % de todo el gasto en TI».
¿Cuál es más preciso?
Permítanme compartir nuestras perspectivas internas. En resumen, es similar a las nuevas empresas que compiten contra las empresas: tasa de crecimiento versus escala.
Ahora echemos un vistazo más de cerca a uno de los grandes volcados de datos de nuestro cliente. Esta empresa tiene 500 petabytes (1 PB equivale a 1000 terabytes) de datos analizados en las instalaciones. Este conjunto de datos está creciendo moderadamente a una tasa del 15% por año. Actualmente, los ayudamos a analizar 1,2 PB de sus datos, lo que representa el 0,24 % del total de sus datos estructurados. Este mismo cliente tiene un proyecto relativamente nuevo, que reside en la nube, con un tamaño aproximado de 220 TB, que está creciendo exponencialmente a una tasa del 100 % anual.
Dentro de cinco años, esta empresa tendrá más de 1000 PB en las instalaciones y alrededor de 7 PB en la nube. Cuando entregamos el 5 % de los datos locales, analizamos 60 PB. En comparación, si tuviéramos que analizar el 50 % de sus datos en la nube, daríamos servicio a 3,5 PB.
Es obvio que el valor que genera el cliente al analizar on-prem (en relación a la nube), es mucho mayor. Por nuestra parte, generaríamos más de 10 veces más ingresos, con un margen mayor, mayor eficiencia y un potencial de crecimiento mucho mayor. Pero entonces, esto es en las instalaciones, un enfoque tan «de la vieja escuela» que apenas puedes susurrar su nombre, especialmente en el ecosistema de inicio.
En conversaciones que he mantenido durante los últimos años con actores clave en este ecosistema (inversores, empresas emergentes, fundadores, estrategas y expertos en datos), todos se hacen eco de esta percepción: el valor anticipado que se logrará a través de los datos se encuentra principalmente en la nube. Su percepción es que en las instalaciones es un mundo que desaparece rápidamente y que vale mucho menos, aunque la mayor parte del valor reside en las instalaciones.
Hablando de eso, los centros de datos de AWS, GCP, Azure y otros competidores de proveedores de la nube están internamente en las instalaciones, y todas estas plataformas obviamente están creciendo como locos.
El borde está cerca
Estos mismos analistas de antes también dicen ahora que en cinco a 10 años, el 80 % de los datos recopilados por sensores se analizarán en el propio sensor o muy cerca de él (borde, IoT), y en esto tiendo a estar de acuerdo con ellos. Las mejores prácticas son analizar los datos lo más cerca posible de donde se crearon. Pero esto nos lleva a la misma conclusión: el análisis de datos en el sensor o cerca de él será puramente local/en el sensor.
Estamos viendo casos de uso iniciales de esto, y está claro que vendrán más. Esto me lleva a mi último punto.
La transición hacia atrás
La transición comenzó hace un tiempo y se aceleró con el comienzo de Covid-19: comenzamos a ver tráfico de diferentes empresas que adoptaban un enfoque más híbrido, en el que los clientes movían sus datos a la nube o volvían de la nube a las instalaciones, o ambas cosas. Esto se debió a muchas consideraciones estándar, así como a nuevas consideraciones, como superar problemas de costos, prácticas de datos más eficientes y la disponibilidad de centros de datos.
Otro punto que estamos presenciando y que ha sido sorprendente es que las nuevas empresas de tecnología basada en datos (cuyos datos nacieron en la nube) están comenzando a trasladar algunos de sus casos de uso a las instalaciones, debido a consideraciones de costo y rendimiento. Este cambio ocurre con mayor frecuencia cuando el caso de uso involucra IA o ML, lo que requiere el entrenamiento continuo de modelos en conjuntos de datos en constante crecimiento. Ahora es un entendimiento mucho más común que para obtener mejores predicciones, debe entrenar sus modelos en conjuntos de datos más grandes. Al entrenar sus modelos AI/ML con o sin una máquina de GPU virtual en la nube, a partir de cierto punto, sería demasiado costoso.
Mejores prácticas para obtener información más rápidamente
Ya sea en la nube, en las instalaciones o en el borde, necesita la capacidad de ingerir sus datos en crecimiento, analizarlos y obtener conocimientos críticos rápidos. Las uniones múltiples y otras consultas complejas requieren tiempo y recursos, especialmente a medida que crecen los datos. Por lo tanto, para obtener el mejor rendimiento, un TTTI mínimo (tiempo total de conocimiento), un movimiento de datos mínimo y rentabilidad, siempre debe considerar procesar los datos lo más cerca posible del origen. On-prem, en la nube y en el perímetro no solo es híbrido; es tribrido.
Luego está el enfoque sin código. Eliminar la barrera de las habilidades (donde no es obligatorio) ahorrará tiempo y dinero en su camino hacia preguntas más importantes. Por ejemplo, las soluciones ELT administradas podrían automatizar la transición de datos de ventas y marketing de una organización. Vemos este enfoque en un número cada vez mayor de empresas medianas y grandes que están comenzando su transformación digital con bastante facilidad (en comparación con hace tres años).
Las organizaciones que buscan aprovechar al máximo sus datos harían bien en tener en cuenta lo anterior a medida que desarrollan su estrategia de datos y deciden dónde enfocar sus energías. Hacerlo bien significa poder hacer preguntas más importantes sobre sus datos, lo que, como todos sabemos, es el final del juego, independientemente de dónde se encuentren sus datos.
El Consejo de Tecnología de Forbes es una comunidad a la que solo se puede acceder por invitación para CIO, CTO y ejecutivos de tecnología de clase mundial. ¿Califico?