Autor invitado: Alvy (www.microsiervos.com)
En 2020, el grupo Digital Realty dio a conocer el concepto de Data Gravity Index (DGx) o índice de la «fuerza de atracción de los datos» y sus efectos en las empresas. Data gravity es una idea que resume en un sólo valor procedente de una fórmula matemática (reminiscente de la Ley de gravitación universal de Newton) las necesidades de infraestructuras tecnológicas y de comunicaciones de las empresas como consecuencia de la generación de datos corporativos.
El concepto de data gravity lo acuñó Dave McCrory allá por 2010 y en 2020 estableció el Índice Data Gravity, el indicador que mide la creación de datos corporativos y predice su crecimiento futuro. Incluye los valores de esa gravitación de los datos las dos mil mayores empresas cotizadas en bolsa de la lista Forbes G2000, que tienen presencia en 53 ciudades de todo el mundo y operan 23 sectores de actividad económica.
La fuerza de atracción de los datos
La base del DGx es obtener un valor único para cada elemento a comparar, ya sea una empresa, un sector de actividad económica o una ciudad, partiendo de cuatro valores básicos, que pueden obtenerse a partir de diversas fuentes oficiales:
- La masa de datos: cuántos datos se almacenan
- La actividad de datos: cuántos datos se transfieren
- El ancho de banda: la capacidad de las comunicaciones
- La latencia: el «retardo» en las comunicaciones

Fuente: Data Gravity Index
Observando la fórmula (DM × DA × BW) / L² puede verse cómo el total es directamente proporcional a los tres primeros valores: cuantos más datos, más actividad tengan y mayor ancho de banda esté disponible, será más grande. La latencia en cambio afecta de forma inversamente proporcional: cuanto menos retardo haya, mayor será el valor total (de hecho, para cualquier dispositivo se prefieren «latencias más bajas» porque eso supone que los tiempos de respuesta son menores). El resultado es una curiosa combinación de terabytes, petaflops, gigabytes por segundo y microsegundos que dan un valor total para una situación concreta.
La implicación de esa fórmula puede entenderse sin complicaciones físicas y matemáticas con una frase: «los datos atraen a los datos». Además de eso hay que saber que «cuanto mayor sea el valor, más complicado resultará mover esos datos», del mismo modo que es más difícil mover una pesada piedra que un pequeño guijarro. Es interesante que esta analogía resulte tan apropiada: quizá podamos mover muchos más datos si no nos importa hacerlo más despacio (o con más retardo), pero es difícil hacerlo en poco tiempo, muy deprisa y si hay grandísimas cantidades de datos. Pero todo eso se puede medir.
Los cálculos que hace internamente el estudio de Digital Realty son bastante más complejos, pues estas cuatro variables se desglosan en otras. En realidad, incluye más de mil atributos distintos para cada empresa, incluyendo entre ellos el número de empleados y ubicaciones; los nodos de red, centros de datos y nube con los que cuenta; los ratios de creación, transferencia de datos y latencia (que dependen del sector en que se enmarque) y un largo etcétera.
Un ejemplo ilustrativo sería considerar el caso de una empresa de medios «estilo Netflix»: para conocer el valor se tiene en cuenta el volumen de datos total de las películas y series que almacena, cuánta actividad de datos genera (como empresa del sector de los contenidos audiovisuales), dónde tiene sus centros de datos, nodos y presencia en la nube y cuál es la latencia típica de ese tipo de contenidos para los usuarios finales a los que se dirige. O si se quisiera calcular el valor de data gravity para una ciudad como París, Madrid o Yakarta, bastaría con sumar los valores de las empresas de la lista Forbes G2000 que tienen presencia allí; la suma total indicará el valor agregado de cara a construir un índice.
Si se calculan todos los valores para las dos mil empresas del Forbes G2000, o las ciudades más importantes del mundo, y se ordenan de mayor a menor, el resultado es un ránking del que se pueden sacar interesantes conclusiones, tanto actuales como a futuro.