La constante migración a la nube se convirtió en una estampida bajo COVID-19, y ha expuesto algunas de las deficiencias del modelo de cálculo compartido, especialmente en lo que se refiere a los gastos individuales. Ahora las empresas están revisando sus compromisos con la nube en un intento de reducir la exposición financiera, especialmente cuando se trata de grandes análisis de datos.
La pandemia COVID-19 ha cambiado muchos aspectos de la vida, incluyendo dónde las compañías obtienen su poder de computación y dónde almacenan sus datos. Mientras que la cantidad de capacidad de computación en las instalaciones todavía empequeñece la nube, las nubes públicas están creciendo más rápido, y el impulso a la nube ha crecido bajo COVID-19.
Los datos del Synergy Research Group muestran que, durante el segundo trimestre que terminó el 30 de junio, el gasto en servicios de infraestructura de nubes superó los 30.000 millones de dólares, lo que supone un aumento de 7.500 millones de dólares, o un 33% más que en el segundo trimestre de 2019. «A medida que las empresas luchan por adaptarse a las nuevas normas, las ventajas de la nube pública se amplifican», dijo el analista jefe de Synergy Research, John Dinsdale, en un informe de investigación.
La empresa media ha aumentado su gasto en nubes en un 59% de 2018 a 2020, según una reciente encuesta de IDG. El control de los costes ha surgido como la preocupación número uno sobre la nube pública, según la encuesta de IDG, con el 40% de los encuestados en su encuesta declarando que es el principal desafío.
Los responsables de la toma de decisiones en materia de TI están más preocupados por el gasto que por una serie de preocupaciones sobre la privacidad, la seguridad y la gobernanza de los datos, según el informe. Esto se basa en la experiencia de ParkMyCloud, una empresa con sede en Virginia que ayuda a las empresas a gestionar sus inversiones y su exposición a la infraestructura de nubes públicas.
«Hace cinco o diez años, se centraba realmente en la seguridad, en lo segura que es la nube, en si van a tener acceso a mis datos, en todo este tipo de cosas», dice Jay Chapel, vicepresidente de ParkMyCloud. «Luego hubo muchos problemas relacionados con la gobernabilidad y quién tiene acceso a las fuentes de datos».
La conversación ha cambiado, y hoy en día la principal preocupación que expresan los clientes es mantenerse al tanto de los gastos, dice. «Ahora cuando hablamos con gente que es nueva en la nube, realmente tienen el mensaje de optimización», dice Chapel.
Aunque son conscientes del problema de los gastos, eso no se traduce necesariamente en acción. Según Chapel, los clientes de la nube siguen sobreaprovisionando sus recursos de la nube y pagando demasiado por ello.
«Analizamos todos los recursos de nuestra plataforma y, en general, los clientes están usando menos del 10% de lo que han aprovisionado en términos de capacidad», dice Chapel. «Casi todos los clientes con los que hablamos que son grandes, encontraron que están gastando más dinero del que esperaban.»
El sobreaprovisionamiento no es nada nuevo. Las compañías lo han estado haciendo con recursos de alta calidad durante años. No era inusual ver servidores X86 funcionando a menos del 10% de su capacidad (los clientes que utilizan equipos caros de gama media y de «hierro grande» de la computadora central tradicionalmente han sido mejores en el dimensionamiento de sus servidores).
Tal vez no sea extraño, entonces, que el sobreaprovisionamiento haya continuado en la nube. ¿Pero cuál es la fuente de este sobreaprovisionamiento? Esa es una pregunta que la Capilla ha hecho.
«Muchos de ellos no han hecho un dimensionamiento y alcance adecuados al migrar a la nube», dice Chapel. «Cada aumento de tamaño [from EC2 small to medium, for example] es un aumento de precio del 50%, básicamente. Si has sobreprovisto tu recurso, eso es un enorme aumento del precio con respecto a lo que pensabas que tenías en prem cuando te mueves a la nube».
ParkMyCloud ayuda a las empresas a encontrar el recurso de nube de tamaño apropiado para sus aplicaciones. También ayudan a reducir el gasto en nubes de sus clientes identificando las cargas de trabajo que se pueden desactivar por la noche y los fines de semana, que es otro lugar para ahorrar dinero en la nube.
Por ejemplo, la empresa tiene varios clientes que ejecutan grandes cargas de trabajo de datos a través de Databricks en la nube Azure. ParkMyCloud puede detectar cuando los científicos de datos empiezan a acceder a los recursos de Databricks y Azure por la mañana, y cuando han terminado por el día.
«Vemos decenas de miles de esas cargas de trabajo giradas, estallan durante el día, desaparecen por la noche y vuelven mañana», dice Chapel. «Esa es la forma en que la nube ha sido construida, por la elasticidad. Reduce los costos, y esencialmente estás haciendo todo a pedido. No todo se puede hacer así. Pero vemos mucho de eso con grandes datos».
Apache Spark, en el que se basa la nube de Databricks, es un marco de trabajo en memoria muy poderoso para el análisis de grandes datos, pero es notoriamente difícil de afinar. Con eso en mente, no es sorprendente que Databricks haya tomado medidas para ayudar a proteger a los clientes de las facturas excesivas de la nube. Databricks, que fue fundado por los creadores de Spark, se asoció estrechamente con Microsoft en 2017, y puso en marcha su servicio Azure junto con Microsoft a principios de 2018.
La chispa juega un papel importante en los grandes análisis de datos y también es la culpable de algunos desperdicios de nubes. El mes pasado, Pepperdata publicó un estudio que encontró que las empresas estaban esencialmente desperdiciando el 60% de su memoria en los clusters de Spark. En total, Pepperdata estimó que las compañías desperdiciarían 17.6 mil millones de dólares en la nube este año (en todas las nubes y cargas de trabajo).
Las empresas pueden ahorrar la mayor cantidad de dinero en la nube si vigilan de cerca los recursos de computación (en lugar de almacenamiento). Pueden invertir en herramientas de terceros que apagan automáticamente las instancias no utilizadas por la noche y los fines de semana, lo que puede reducir los costos en más de un 65%, según Chapel.
Pero no es fácil manipular otras partes de la pila, como las bases de datos, lo que requiere una mayor persistencia del recurso subyacente. «¿Qué vas a hacer con él? No puedes encogerlo. No puedes apagarlo», dice Chapel. «Así que sólo va a crecer».