Los datos corporativos crecen y se atraen con más fuerza

Las empresas necesitan hoy infraestructura distribuida para su gestión

10 Mayo 2021

Autor invitado: Alvy (www.microsiervos.com)

 

En 2020, el grupo Digital Realty dio a conocer el concepto de Data Gravity Index (DGx) o índice de la «fuerza de atracción de los datos» y sus efectos en las empresas. Data gravity es una idea que resume en un sólo valor procedente de una fórmula matemática (reminiscente de la Ley de gravitación universal de Newton) las necesidades de infraestructuras tecnológicas y de comunicaciones de las empresas como consecuencia de la generación de datos corporativos.

El concepto de data gravity lo acuñó Dave McCrory allá por 2010 y en 2020 estableció el Índice Data Gravity, el indicador que mide la creación de datos corporativos y predice su crecimiento futuro. Incluye los valores de esa gravitación de los datos las dos mil mayores empresas cotizadas en bolsa de la lista Forbes G2000, que tienen presencia en 53 ciudades de todo el mundo y operan 23 sectores de actividad económica.

 

La fuerza de atracción de los datos

La base del DGx es obtener un valor único para cada elemento a comparar, ya sea una empresa, un sector de actividad económica o una ciudad, partiendo de cuatro valores básicos, que pueden obtenerse a partir de diversas fuentes oficiales:

  • La masa de datos: cuántos datos se almacenan
  • La actividad de datos: cuántos datos se transfieren
  • El ancho de banda: la capacidad de las comunicaciones
  • La latencia: el «retardo» en las comunicaciones

 

data gravity index

Fuente: Data Gravity Index

 

Observando la fórmula (DM × DA × BW) / L² puede verse cómo el total es directamente proporcional a los tres primeros valores: cuantos más datos, más actividad tengan y mayor ancho de banda esté disponible, será más grande. La latencia en cambio afecta de forma inversamente proporcional: cuanto menos retardo haya, mayor será el valor total (de hecho, para cualquier dispositivo se prefieren «latencias más bajas» porque eso supone que los tiempos de respuesta son menores). El resultado es una curiosa combinación de terabytes, petaflops, gigabytes por segundo y microsegundos que dan un valor total para una situación concreta.

La implicación de esa fórmula puede entenderse sin complicaciones físicas y matemáticas con una frase: «los datos atraen a los datos». Además de eso hay que saber que «cuanto mayor sea el valor, más complicado resultará mover esos datos», del mismo modo que es más difícil mover una pesada piedra que un pequeño guijarro. Es interesante que esta analogía resulte tan apropiada: quizá podamos mover muchos más datos si no nos importa hacerlo más despacio (o con más retardo), pero es difícil hacerlo en poco tiempo, muy deprisa y si hay grandísimas cantidades de datos. Pero todo eso se puede medir.

Los cálculos que hace internamente el estudio de Digital Realty son bastante más complejos, pues estas cuatro variables se desglosan en otras. En realidad, incluye más de mil atributos distintos para cada empresa, incluyendo entre ellos el número de empleados y ubicaciones; los nodos de red, centros de datos y nube con los que cuenta; los ratios de creación, transferencia de datos y latencia (que dependen del sector en que se enmarque) y un largo etcétera.

Un ejemplo ilustrativo sería considerar el caso de una empresa de medios «estilo Netflix»: para conocer el valor se tiene en cuenta el volumen de datos total de las películas y series que almacena, cuánta actividad de datos genera (como empresa del sector de los contenidos audiovisuales), dónde tiene sus centros de datos, nodos y presencia en la nube y cuál es la latencia típica de ese tipo de contenidos para los usuarios finales a los que se dirige. O si se quisiera calcular el valor de data gravity para una ciudad como París, Madrid o Yakarta, bastaría con sumar los valores de las empresas de la lista Forbes G2000 que tienen presencia allí; la suma total indicará el valor agregado de cara a construir un índice.

Si se calculan todos los valores para las dos mil empresas del Forbes G2000, o las ciudades más importantes del mundo, y se ordenan de mayor a menor, el resultado es un nking del que se pueden sacar interesantes conclusiones, tanto actuales como a futuro.

Cómo el concepto de data gravity supone un reto para las empresas

El efecto de esta «fuerza de atracción de los datos» hace que cuanto mayor sea su intensidad más problemático resulte para las empresas «gravitar» a su alrededor. Es algo parecido al hecho de que sea más complicado navegar con una nave espacial cerca de un planeta con una alta densidad de masa o de un agujero negro que alrededor de un pequeño planeta o un asteroide con poca masa.

Hay muchos factores que influyen en este reto de la “intensidad de los datos” de las empresas. Están el propio crecimiento del volumen de datos y su intercambio; la mayor digitalización de los flujos de trabajo; el aumento de las exigencias regulatorias o el aumento los tipos de datos y las fuentes de las que se recogen. También está la gestión de todo ello en un mayor número de ubicaciones.

Esto hace que a las empresas les interese estar cerca de las ciudades clave desde el punto de vista de los datos y contar con infraestructuras en los lugares adecuados: donde el valor de data gravity es mayor. Hacerlo supone acercar a sus usuarios, redes y nubes a los lugares donde está la mayor acumulación de datos, los que más se procesan y con los que más se intercambian. Es algo que se refleja en el llamado «ciclo de creación de los datos»: la forma en que las personas y los dispositivos crean datos; cómo se procesan mediante interacciones y transacciones y cómo se agregan, intercambian, analizan y enriquecen de múltiples formas. En cierto modo, recuerda a cómo las empresas logísticas establecen sus sedes lo más cerca posible de los hubs de transporte marítimo y aéreo porque es allí donde está «la acción».

Las tecnologías que requieren almacenamiento y procesamiento masivo de datos son cada vez más comunes. La inteligencia artificial o el big data suelen usarse como buenos ejemplos. Pero no todo el mundo tiene la habilidad para gestionarlos de forma distribuida. Así que muchas veces es más fácil, rápido y efectivo operar con ellos allí donde están los demás datos, cerca de las fuentes de información o los propios usuarios. Las operaciones financieras en los mercados de valores, donde los microsegundos pueden ser clave para operar con rentabilidad, son otro gran ejemplo.

 

Una visión a futuro

Con datos entre 2020 y 2024, el informe del Data Gravity Index muestra también las previsiones a futuro, tanto a nivel mundial como por países y sectores. La palabra clave aquí es exponencial. Para entender la gráfica hay que tener en cuenta que el valor indicado supone una tasa de crecimiento anual compuesto del 139% (en inglés: CAGR, compound annual growth rate). En la práctica significa que cada año el valor se multiplica por cerca de 2,4 sucesivamente (crece aproximadamente un 140% cada año). A modo de ejemplo, el valor de data gravity del sector de servicios financieros pasará de ser 24 GB/s en 2020 a 867 GB/s en 2024 con un CAGR del 146%. El crecimiento es tan espectacular que se suele utilizar una escala logarítmica en las gráficas (log10; cada marca es diez veces más grande que la anterior).

Las previsiones permiten ver cómo evolucionarán los valores de data gravity por sectores (banca y servicios financieros, productos informáticos, servicios educativos, asistencia sanitaria, medios de comunicación y entretenimiento, administración pública) o incluso por ciudades. Las tres cuartas partes de estos sectores tendrán un CAGR de más del 144% anual.

En cuanto a ciudades, algunas como Singapur experimentarán un gigantesco crecimiento del 200% compuesto anual. Madrid y Barcelona son las ciudades españolas que ya aparece en el selecto grupo de las 53 ciudades del Índice Data Gravity. Madrid, por ejemplo, experimentará un fuerte impulso que la llevará de valores alrededor de los 0,6 GB/s hasta 13,42 GB/s, multiplicando casi por veinte su valor en el ranking de data gravity. En el caso de Barcelona pasará de 0 a 0,1 GB/s. Los sectores con empresas más relevantes en este sentido para nuestro país son tres: la minería y recursos naturales, los servicios profesionales y el procesamiento de datos corporativos.

 

data gravity index europa

Fuente: Data Gravity Index

 

Lo más interesante es quizá que en cuanto a regiones Europa sigue dominando a nivel mundial como región hiperconectada con una fuerza de atracción muy por encima de las regiones de Asia-Pacífico y América del Norte. Está creciendo a un ritmo más acelerado que América del Norte (casi el doble) y con un valor extraído de la fórmula de cerca de 7.000 GB/s estará en 2024 todavía muy lejos de los 4.000 de Asia-Pacífico, beneficiando de este modo a todas las empresas establecidas en el viejo continente y a todos sus usuarios y clientes.

Descarga el informe Data Gravity Index