10.14718/revfinanzpolitecon.v16.n2.2024.4 Artículos de investigación |
Julio César Alonso Cifuentes*
* Doctor en Economía. Profesor
y director del Centro de Investigación en Economía y Finanzas (Cienfi),
Facultad de Negocios y Economía, Universidad Icesi, Cali (Colombia).
jcalonso@icesi.edu.co.
0000-0003-4890-7122
María Paula Ocampo Arango**
** Magíster en Economía. Investigadora del Centro de Investigación en Economía y Finanzas (Cienfi),
Universidad Icesi, Cali (Colombia).
maria.ocampo1@u.icesi.edu.co.
0009-0009-6617-8761
Recibido: 5 de enero de 2024
Evaluado: 30 de marzo de 2024
Aprobado: 10 de mayo de 2024
Como citar: Alonso Cifuentes, J. C., y Ocampo Arango, M. P. (2024). Evolución de la estructura de la economía colombiana a partir de la teoría de redes y detección de comunidades para el periodo 2005-2021. Revista Finanzas Y Política Económica, 16(2), 401–439. https://doi.org/10.14718/revfinanzpolitecon.v16.n2.2024.4
Resumen
Este documento estudia la evolución de la estructura de la economía colombiana empleando herramientas de la teoría de redes. Para lograr el objetivo se construyeron las matrices insumo-producto (MIP) actividad-actividad para 61 ramas en los años 2005 a 2021 y se emplean el diámetro y la densidad para caracterizar las redes. Adicionalmente, se usan algoritmos de detección de comunidades para identificar las ramas de actividad económica que tienen una interconexión más fuerte cada año. Finalmente, se emplea, por primera vez en la literatura de análisis de redes, una metodología de análisis de estabilidad de clústeres para detectar cambios de un año a otro en la composición de las comunidades. Se encuentran siete comunidades y la existencia de cambios en la red que se reflejan en la MIP durante el periodo 20052021; sin embargo, no son sustanciales como para evidenciar fuertes cambios estructurales, al menos desde un punto de vista de comunidades.
Clasificación JEL: D57, L140.
Palabras clave: Colombia; estructura productiva; redes; detección de comunidades; estabilidad de clústeres; matriz insumo-producto.
Abstract
This paper studies the evolution of the structure of the Colombian economy using network theory tools. To achieve this objective, activity-activity input-output (I-O) matrices for 61 sectors were constructed for the years 2005 to 2021, and diameter and density were used to characterize the networks. Additionally, community detection algorithms were used to identify the economic activity sectors that have a stronger interconnection each year. Finally, for the first time in the network analysis literature, a cluster stability analysis methodology was used to detect changes in community composition from one year to another. Seven communities were identified, and changes in the network were found to be reflected in the I-O matrix during the period 2005-2021; however, these were not substantial enough to evidence strong structural changes, at least from a community perspective.
Keywords: Colombia; productive structure; networks; community detection algorithms; cluster stability analysis; input output matrix.
INTRODUCCIÓN
Las matrices insumo-producto (MIP) del Sistema de Cuentas Nacionales (SCN) son empleadas para analizar las interacciones entre las diferentes ramas de actividad económica de una economía. Estas matrices registran cómo la producción de una rama es utilizada como insumo por otra, creando así una red de relaciones económicas. Desde los estudios pioneros como los de Rasmussen (1956), Laumas (1975), Schultz (1977) y Hewings (1982) se ha empleado el álgebra matricial y herramientas como los multiplicadores de Leontief para analizar los datos de estas matrices. Algunos autores como Baumol (2000a) han afirmado que el análisis tradicional basado en las MIP puede ser considerado como una de las contribuciones más importantes a la ciencia económica del siglo XX, ya que ha facilitado una fuerte interdependencia entre teoría, datos y aplicación.
Estas herramientas se han convertido en un estándar de la medición económica (Lora & Prada, 2023). Las aplicaciones del análisis tradicional de las MIP son variadas; van desde determinar el impacto de cambios en la demanda final en la economía (por ejemplo Baumol, 2000b), hasta encontrar los efectos de cambios en la producción de una rama en el resto de la economía (ver capítulo 6 de Miller & Blair, 2009) o el calcular multiplicadores que llevan al análisis de encadenamientos productivos (por ejemplo Hirschman, 1958) o detección de cambios estructurales (Guo & Planting, 2000). En la actualidad, estas herramientas siguen siendo relevantes, a pesar de la aparición de enfoques que implican el modelado de la economía como los modelos de equilibrio general (Jorgenson, 2016). Por otro lado, existe una metodología relativamente nueva para examinar la estructura productiva representada en la MIP: la teoría de redes.
La teoría de redes surge de diversas áreas del conocimiento que buscan resolver problemas con estructuras de datos que presentan interrelaciones entre individuos (Alonso & Carabali, 2019). Desde los años treinta, los sociólogos han valorado la importancia de los patrones de conexión entre las personas para comprender cómo funciona una sociedad (Wasserman & Faust, 1994). Los investigadores han utilizado las redes para analizar diversos fenómenos, como la propagación de enfermedades, la formación de grupos y comunidades, y la difusión de información (Graham & De Paula, 2020). La teoría de redes analiza las características y propiedades de las redes, y su visualización a través de grafos.
En la Figura 1 podemos ver un ejemplo de un grafo que muestra la MIP (las compras de productos que se emplean en el consumo intermedio para producir) de las 61 ramas de actividad económica en 2015 en Colombia. Los círculos (nodos) representan a cada una de las ramas de actividad y las líneas que conectan a los puntos (aristas) representan las transacciones entre las ramas.
Figura 1. Ejemplo de un grafo paras ¡as 61 ramas de actividad presentes en la matriz insumo-producto para el año 2015
Nota: cada nodo (círculo) representa una rama de actividad económica de
acuerdo con la clasificación CIIU Revisión 4 Armonizada para Colombia (Rev. 4 A.C.). En la Tabla 2 se puede ver el código de cada rama y su respectivo nombre. El color de
cada nodo representa la comunidad a la que pertenece (esto se discutirá más
adelante en detalle).
Fuente: elaboración de los autores.
Las herramientas de la teoría de redes permiten detectar conjuntos (comunidades) de nodos que están más estrechamente relacionados entre sí que con el resto de los nodos en la red. Las comunidades se pueden armar empleando criterios como la densidad de conexiones internas y una menor cantidad de conexiones con los nodos fuera de la comunidad (Araújo & Faustino, 2017). En últimas, la detección de comunidades corresponde a un ejercicio de encontrar clústeres (en el sentido estadístico) de ramas de actividad económica que están más densamente conectadas entre sí que con el resto de la red. Las ramas de actividad económica en una comunidad presentan relaciones más fuertes o más frecuentes, compartiendo características comunes (Araújo & Faustino, 2017). En la Figura 1 las comunidades se representan por el color de los nodos. Se encontraron siete comunidades (más adelante se explicará cómo se llega a este número).
Es interesante detectar comunidades en una red creada a partir de una MIP porque proporciona información valiosa sobre la estructura y las interrelaciones de la economía (Xu & Liang, 2019). Al identificar comunidades podemos entender a partir de los datos, y no de las preconcepciones de los analistas, cómo se agrupan y relacionan las diferentes ramas de actividad económica en términos de sus interdependencias y flujos de insumos. Esto permite identificar patrones de especialización, interconexiones económicas sectoriales, y la existencia de ramas de actividad económica altamente dependientes (clústeres industriales).
El objetivo de este documento es estudiar la evolución de las interrelaciones del aparato productivo colombiano que se reflejan en las comunidades de ramas de actividad económica implícitas en la MIP entre los años 2005 y 2021. Para lograr este objetivo se emplean herramientas de la teoría de redes para analizar las MIP a nivel actividad-actividad de Colombia. Además, se prueban diferentes opciones para crear comunidades de ramas de actividad económica. Posteriormente, se presenta un análisis de estabilidad de las comunidades que es común en la literatura de clústering (en el sentido estadístico) para evidenciar si las comunidades cambian o no de un año a otro. Adicionalmente, para este estudio fue necesario construir las MIP de Colombia para 17 años (de 2005 a 2021) a partir de los cuadros oferta y utilización (COU) publicados por el Departamento Administrativo Nacional de Estadística (DANE).
Este estudio amplía la literatura en tres sentidos. Primero, analiza la evolución de la estructura productiva colombiana implícita en MIP empleando métricas de la teoría de redes. Segundo, explora un conjunto de técnicas de detección de comunidades para encontrar las comunidades formadas en cada año. Tercero, aplica el análisis de estabilidad para clústeres tradicionales a las comunidades resultantes del ejercicio. Hasta donde llega el conocimiento de los autores, este análisis de estabilidad no se ha intentado anteriormente en el contexto del análisis de redes. Finalmente, se construyen las MIP para el periodo 2005-2021.
Este documento está dividido en cuatro apartados. En el primer apartado se hace una breve revisión de literatura sobre el uso de la teoría de redes en el ámbito económico; en el segundo apartado de expone la metodología empleada; en el tercero se discute cómo se construyen los datos utilizados y, en el cuarto, se muestran los resultados obtenidos. El documento concluye con unos comentarios finales.
REVISIÓN DE LA LITERATURA
La teoría de redes se ha convertido en una herramienta cada vez más valiosa en el análisis de problemas económicos. En el ámbito del comercio internacional, se han empleado los grafos y las herramientas de la teoría de redes para representar las relaciones comerciales entre países, con el fin de identificar los principales actores de la red, los flujos comerciales más importantes y las relaciones entre los distintos sectores económicos (ver, por ejemplo, Beaton et al., 2017; Zhou et al., 2016; Hidalgo & Hausmann, 2010; Fagiolo et al., 2008). En Colombia, Borda-Blanco (2017) compara diferentes metodologías, que incluyen la teoría de redes, para analizar la complejidad del comercio exterior a nivel departamental y mundial entre los años 2012 y 20151.
En la literatura que estudia el mercado laboral también se han empleado estas herramientas para analizar cómo los trabajadores encuentran trabajo a través de sus contactos personales, en lugar de hacerlo mediante los canales tradicionales de anuncios de empleo (Myers & Shultz, 1951; Granovetter, 1978). Recientemente, O'Clery et al. (2019) presentan una aplicación al caso colombiano para comprender cómo se relacionan los empleadores y los empleados, y cómo la estructura de la red laboral puede afectar la movilidad, integración y dinámica del mercado para 62 municipios.
Otros ejemplos del uso de las herramientas de redes en problemas económicos y de los negocios se presentan en el análisis de redes de innovación (König et al., 2008; Montresor & Marzetti, 2009), el flujo de miembros de juntas directivas entre empresas (Clemente & Cornaro, 2019), las relaciones entre productos y su especialización en el comercio exterior (Hidalgo et al., 2007; Jankowska et al., 2012), las redes de propiedad de negocios (Ding & Lu, 2015), los préstamos interbancarios (Iori et al., 2008), la inversiones en acciones (Battiston et al., 2005) y el riesgo sistemático (Lorenz et al., 2009).
En términos de herramientas econométricas, también se han realizado grandes adelantos; por ejemplo, Graham y De Paula (2020) presentan una amplia variedad de modelos econométricos con sus fortalezas y debilidades en el análisis de este tipo de datos.
Una corriente adicional de las aplicaciones de redes en economía es el estudio de las MIP. Las MIP se componen de ramas de actividad y vínculos intersectoriales que son similares a los nodos y bordes del sistema de redes, esto llevó rápidamente a los investigadores a emplear herramientas de la teoría de redes.
Uno de los trabajos pioneros en emplear estas herramientas para el análisis de MIP fue el de Slater (1977). El autor creó agrupaciones de ramas de actividad para Estados Unidos empleando análisis de clústeres a partir de métricas de los nodos. Slater (1978) incorporó más elementos del análisis de redes sociales para investigar la estructura económica. Desde entonces aparecen diferentes estudios que incorporan las herramientas de redes al análisis de la estructura económica implícita en la MIP (Sonis & Hewings, 1998; Acemoglu et al., 2012). Paralelo al análisis cuantitativo de las redes implícitas en la MIP, se ha desarrollado otra área conocida como el análisis cualitativo input-output (QIOA). El QIOA emplea las herramientas desarrolladas en la teoría de grafos dirigidos de tal manera que solo se tiene en cuenta la dirección de las interconexiones y no la magnitud del flujo entre sectores (por ejemplo, Drejer, 2000; Ghosh & Roy, 1998; Aroche-Reyes, 2003; Schnabl, 1994).
Regresando al análisis cuantitativo de la redes, se encuentran trabajos como los de McNerney et al. (2013) que estudian la estructura de las relaciones entre industrias para 45 economías nacionales. Los autores emplean datos de MIP para 2002 y 2006 producidas por la Organización para la Cooperación y el Desarrollo Económicos (OCDE) y métricas tradicionales. Sun et al. (2018) analizan los sectores y conexiones más importantes de la economía china para comprender el efecto sobre la economía global. Este estudio se centró en las redes provinciales y en la red interprovincial, siguiendo una línea de investigación que estudia las estructuras de las economías regionales con herramientas de redes (por ejemplo Giuliani, 2013; García et al., 2008; García, 2013).
Por su parte, Xing et al. (2018) estudian el grado de globalización de los sectores industriales en la cadena de valor global construyendo MIP entre los países a partir de datos del World Input-Output Database (WIOD) para el año 2016. Los autores consideraron el flujo de productos intermedios en la cadena de valor global como un proceso de Markov para encontrar la cantidad adicional de trabajo que se realiza en un sistema de producción específico cuando la demanda final a nivel global aumenta.
Araújo y Faustino (2017) emplean la teoría de redes para estudiar el efecto de la crisis financiera de 1998 y posterior programa de ajuste económico en la estructura productiva de Portugal. Los autores centran su atención en analizar el periodo 2000 a 2014 y emplear métricas de la teoría de redes para estudiar las relaciones interindustriales. La evolución de estas métricas les permitió evidenciar el cambio estructural para el periodo 2011-2014 y demostrar la utilidad de las herramientas de la teoría de redes para el análisis de las relaciones interindustriales. Este trabajo no presenta una comparación formal de las métricas para establecer el cambio estructural.
Xu y Liang (2019) emplean análisis de redes y construcción de comunidades para estudiar una MIP construida para 41 economías empleando datos del WIOD para el año 2019. Los autores encuentran que la industria de minas y canteras del resto del mundo es el sector más central de la economía mundial. Así mismo, identifican a los servicios gubernamentales de Estados Unidos como el motor de la economía mundial, mientras que la industria de servicios estadounidense es el proveedor más importante. Los autores no presentan un análisis formal de los cambios en las comunidades para establecer cambio estructural.
DePaolis et al. (2022) emplean datos de MIP a nivel de condado, área metropolitana y estado para Estados Unidos, y medidas de centralidad basadas en caminos aleatorios para identificar los principales sectores.
Por otro lado, Domínguez et al. (2021) investigan la convergencia de la productividad de 106 sectores productivos en Japón durante el periodo 2003-2012. Los autores emplean un análisis de comunidades para encontrar dos grupos que están altamente intercomunicados. Una vez establecidas las comunidades encuentran que la membrecía de los sectores a las comunidades no varía mucho. Los autores no realizan un análisis formal de estabilidad de las comunidades. Con las comunidades establecidas, se realiza un análisis tradicional de series de tiempo de convergencia de productividad de los sectores relacionados como el sugerido por Barro y Sala-i-Martin (1992).
En la literatura que emplea las herramientas de redes para analizar las MIP se encuentra otra vertiente de estudios que no se interesan por la estructura de la economías per se, sino por la propagación de diferentes fenómenos por la red. Por ejemplo, Blöchl et al. (2011) emplean medidas de centralidad basadas en caminos aleatorios para detectar, en 37 países de la OCDE, cuáles de las ramas de actividad de las que nacen los choques se propagan para generar los ciclos económicos. Contreras y Fagiolo (2014) investigan cómo se propagaron los choques para varios países europeos antes de la Gran Depresión de 1929.
Dotta (2021) estudia el impacto de los impactos tecnológicos y de demanda para diez países suramericanos (Argentina, Brasil, Bolivia, Chile, Colombia, Ecuador, Perú, Paraguay, Uruguay y Venezuela).
Hasta donde llega nuestro conocimiento, para la economía colombiana no se han publicado estudios que caractericen la estructura productiva del país con herramientas de la teoría de redes; no solo en términos de métricas que describan y caractericen las ramas de actividad económica, sino también en cuanto a las comunidades que se forman entre ellas y cómo esas composiciones cambian a lo largo de un periodo de tiempo prolongado. Respecto a la estabilidad de las comunidades, solo se identificó el trabajo reciente de Domínguez et al. (2021) que emplea las comunidades para detectar cambios estructurales, pero los autores no presentan una aproximación formal para probar la estabilidad de la membrecía a las comunidades de las ramas de actividad.
METODOLOGÍA PARA EL ANÁLISIS DE LAS REDES
La teoría de redes provee métricas para analizar la estructura del sistema de producción de un país reflejado en las MIP. Por ejemplo, se pueden emplear métricas globales para caracterizar aspectos como la conectividad, la robustez y la eficiencia de la estructura económica implícita en la MIP (Alonso & Carabali, 2019; Tsekeris, 2017). Dos de las métricas globales más utilizadas son la densidad y el diámetro (para una mayor discusión ver Niño, 2020). La densidad mide la cantidad de conexiones existentes en un grafo, mientras que el diámetro representa la longitud del camino más largo entre dos nodos.
Una red con una alta densidad indica una mayor interconexión entre los nodos. Por otro lado, un diámetro alto indica que los caminos más largos entre pares de nodos en la red son relativamente extensos. Esto significa que hay una distancia geodésica considerable entre los nodos más alejados. Es decir, una ausencia de conexiones directas o rutas más cortas entre ciertos nodos, lo que resulta en la necesidad de recorrer caminos más largos para alcanzar otros nodos en la red.
Además de las métricas están los algoritmos de la teoría de redes que se utilizan para encontrar comunidades de nodos en la red (grupos de ramas de actividad) y los criterios para evaluar dicha selección.
Antes de entrar en el detalle, definamos un grafo como:
G=(V,E),
Donde: V es un conjunto de n nodos y E es un conjunto de m aristas. Este grafo se construye a partir de la matriz de adyacencia A, donde cada entrada αij es el peso de la arista que va desde el nodo i hasta el nodo j. En nuestro caso, las entradas de la matriz de adyacencia serán las celdas de la MIP.
En el contexto de las redes, las comunidades corresponden a conjuntos de nodos que están intercomunicados entre sí, más que con los miembros de otras comunidades. Al final, encontrar comunidades implica realizar un ejercicio de agrupamiento (clústering). La construcción de clústeres implica elegir un algoritmo de agrupamiento y una métrica para determinar el número de clústeres.
La métrica que convencionalmente se emplea para seleccionar el número de comunidades en la literatura de teoría de redes es la modularidad2, propuesta por Newman & Girvan (2002). La modularidad calcula las densidades dentro y fuera de cada clúster y las compara con la densidad general que tendrían si la red fuera construida de manera aleatoria. En otras palabras, evalúa la estructura de una red en términos de cómo se agrupan los nodos en módulos o comunidades, midiendo la calidad de la división. Cuanto mayor sea la modularidad de una red, mayor será su estructura modular, lo que significa que los nodos tienden a formar comunidades densamente conectadas.
De manera formal, la modularidad se define como:
Donde:
deg(i) es el grado del nodo i y ci es el clúster i.
Los valores de modularidad cercanos a cero indican que el número de enlaces dentro del clúster es menor al valor que se esperaría en una red aleatoria. El valor máximo de esta métrica tiende a 1. Valores muy cercanos a uno indican que el clúster está altamente conectado. En la práctica está ampliamente documentado que la modularidad típicamente se encuentra entre 0,3 a 0,7 (Niño, 2020).
La modularidad es tanto un criterio de evaluación de la calidad de las comunidades resultantes de un proceso de detección de comunidades, como una métrica que se optimiza en los diferentes algoritmos de detección de comunidades.
El segundo elemento que se requiere para construir comunidades es un algoritmo para agrupar. En el contexto de las redes existen algoritmos específicos para generar clústeres diferentes a los empleados en la literatura tradicional del clústering3. Estos algoritmos utilizan la modularidad, bien sea como función objetivo (clústering de modularidad óptima y Spin glass) o como forma de decidir el número de clústeres una vez generado un dendrograma (clústering con intermediación de aristas y Walktrap) (Niño, 2020).
El algoritmo de clústering con intermediación de aristas (Edge betweenness clustering) encuentra comunidades identificando las aristas que tienen el mayor valor de intermediación; es decir, las aristas que se encuentran en muchos caminos más cortos entre pares de nodos. Encontrar comunidades de esta manera se basa en la idea de que, si en una red existen dos comunidades claramente distinguidas, es probable que la arista con la mayor intermediación sea aquella que las une.
En otras palabras, los caminos geodésicos entre los nodos que hacen parte de una de las comunidades y los nodos que hacen parte de otra deberán pasar obligatoriamente por una arista, lo cual hace que esta tenga una alta centralidad de intermediación (para un detalle del algoritmo ver Newman & Girvan, 2004).
Luego de generada la estructura jerárquica, es posible elegir el número de comunidades de tal manera que se maximice una métrica de calidad de la partición como la modularidad.
Brandes et al. (2008) propusieron el algoritmo de clústering de modularidad óptima (Optimal clustering) que convierte la modularidad en la función objetivo de un problema de programación lineal de enteros. En especial, para la expresión λ(ci, cj) se prueban todas las particiones posibles y se elige la que maximiza la modularidad.
El algoritmo Walktrap (Pons & Latapy, 2005) se basa en la idea de que un proceso de camino aleatorio puede identificar comunidades, pues la probabilidad de pasar de un nodo a otro que está en la misma comunidad es más alta que la probabilidad de pasar a un nodo que no está en la comunidad, teniendo en cuenta que el grado intraclúster es más alto que el grado interclústeres.
Para lograr este objetivo, se define una medida de la distancia entre dos comunidades basada en la probabilidad de que el camino aleatorio pase de un nodo i en la comunidad c1 a un nodo v en la comunidad c2 en t pasos
Con esto expresado, se define un algoritmo aglomerativo para encontrar una estructura jerárquica (dendrograma) y se elige el número de comunidades que maximice la modularidad.
De acuerdo con Reichardt y Bornholdt (2006), el problema de encontrar comunidades puede ser interpretado como la configuración de spin que minimiza la energía de un sistema Spin Glass (algoritmo Spin Glass). Es importante mencionar que el spin es una forma de momento angular en física de partículas (un vector de movimiento de partículas fundamentales) y un Spin Glass es una colección de partículas con spin caracterizada por la aleatoriedad. Además, los enlaces en un Spin Glass son una mezcla de enlaces ferromagnéticos, donde los enlaces atómicos adyacentes tienen la misma orientación, y enlaces antiferromagnéticos, donde los enlaces atómicos adyacentes tienen orientaciones opuestas.
En el caso de las redes, las partículas serían los nodos y su conjunto sería el spin glass. Cuando dos nodos están conectados se considera un enlace ferromagnético, y cuando no están conectados se considera un enlace antiferromagnético. De esta manera, los estados de spin son los índices de las comunidades, por lo que si se encuentran los estados que minimizan la energía del sistema, se estaría hallando un estado en el que las comunidades son estables.
Como el objetivo final es crear grupos coherentes (bastantes aristas intraclúster) y separados (pocas aristas interclúster), se plantea una función que premia que existan aristas entre nodos del mismo grupo (mismo estado de spin), penaliza la falta de aristas en nodos del mismo grupo, penaliza la existencia de aristas entre nodos de distintos grupos (diferente estado de spin) y premia que haya aristas inexistentes entre grupos distintos. Matemáticamente
donde: ci ∈ {1,2,…,k} denota el estado de spin (comunidad) del nodo i y ω1ij ω2ij, ωij3, ω4ij son los pesos que se les quiera dar a cada criterio. Así, el primer término mide los enlaces internos, el segundo los enlaces no existentes internos, el tercero los enlaces externos y el cuarto los enlaces externos no existentes. Reichardt y Bornholdt (2006) muestran que, si se minimiza el anterior hamiltoniano, se está maximizando la modularidad. En este sentido, este método determina automáticamente el número de clústeres, de manera similar al algoritmo de clúster de modularidad óptima.
Los algoritmos de intermediación de aristas (Edge betweenness clustering), clústering de modularidad óptima (Optimal clustering), Walktrap y spin glass permiten identificar el número óptimo de comunidades, así como la membrecía a cada comunidad de cada nodo. Así, estos algoritmos nos permitirán encontrar las comunidades para cada red (año) y la membrecía a una comunidad de cada una de las ramas de actividad.
Finalmente, en nuestro análisis de las MIP es importante determinar si las comunidades han cambiado o no de un año a otro, es decir, analizar su estabilidad. Para determinar los cambios en las comunidades emplearemos medidas de estabilidad de los clústeres provenientes de la literatura "tradicional" de clústering.
En la literatura de ciencia de datos se han diseñado métricas que tienen como objetivo evaluar si los grupos de individuos asignados a cada clúster han experimentado cambios significativos a lo largo de los periodos bajo estudio. Estas medidas de estabilidad describen el grado de superposición en la intersección de grupos entre dos conjuntos de datos diferentes. Las medidas incluyen la homogeneidad (H), completitud (C), medida V (VM), índice de Rand (RI) e índice de Rand ajustado (ARI). En general, si la superposición entre los grupos es alta, la estabilidad también será alta.
La métrica de homogeneidad (H) entre dos poblaciones o muestras clusteriza-das es una medida de similitud basada en la entropía. La escala de homogeneidad va de 0 a 1, donde 1 indica completa homogeneidad y cero heterogeneidad total4. Otra métrica popular basada en la entropía es la completitud (C). Esta métrica será igual a 1 si todos los miembros de una clase dada en el agrupamiento están asignados al mismo grupo en el siguiente periodo (Rosenberg & Hirschberg, 2007).
Por su parte, la medida V (VM) combina la homogeneidad y la completitud calculando una media armónica ponderada entre esas dos métricas. En este caso también se tiene que un valor de 1 corresponde a una coincidencia perfecta entre los agrupamientos de los dos periodos.
El índice de Rand (RI) presenta un enfoque diferente para comparar agrupa-mientos. Emplea comparaciones pareadas para determinar si ambos agrupamien-tos etiquetan cada punto de datos en el mismo grupo. Un valor de 1 representa un acuerdo exacto entre los agrupamientos de dos periodos, mientras que 0 representa desacuerdo en todos los pares de elementos (Santos & Embrechts, 2009).
Por lo general, las medidas de estabilidad de los clústeres o las medidas de evaluación para un agrupamiento predictivo se basan en un agrupamiento de referencia considerado como la "verdad absoluta". En nuestro caso, utilizaremos estas medidas empleando la pertenencia a una comunidad el año anterior (t-1) como la referencia absoluta para evaluar si la estructura en del año t es similar o no.
Para resumir, nuestra aproximación empírica implica los siguientes pasos:
1. Calcular para cada año (t) las métricas globales para caracterizar las ramas de actividad económica y la red en su conjunto, donde t= 2015, 2016, ... , 2021.
2. Para cada año (t), encontrar el número óptimo de comunidades para cada uno de los siguientes algoritmos: intermediación de aristas, clústering de modularidad óptima, Walktrap y Spin Glass.
3. Para cada año (t) seleccionar la mejor aproximación para construir las comunidades; i. e., el número de comunidades y respectivo método que maximiza la modularidad.
4. Conformar las comunidades para cada año (t) y registrar la membrecía de cada rama de actividad económica a las respectivas comunidades.
5. Comparar la composición de las comunidades del año t con respecto al año t-1 empleando las métricas de homogeneidad (H), completitud (C), medida V (VM), índice de Rand (RI) e índice de Rand ajustado (ARI).
Los anteriores pasos se realizan en el lenguaje estadístico R (R Core Team, 2022) empleando los paquetes tidyverse (Wickham et al., 2019), igraph (Csardi & Nepusz, 2006), cluster (Maechler et al., 2022), NbClust (Charrad et al., 2014), parameters (Lüdecke et al., 2020), dendextend, (Galili, 2015), FNN (Beygelzimer et al., 2023) y keyplayer (An & Liu, 2023).
DATOS
La MIP es una de las matrices del conjunto del SCN. La MIP muestra las interacciones que existen entre los insumos necesarios para la producción de bienes finales o intermedios, de tal forma que se pueda estudiar el flujo de bienes y servicios dentro de la economía, independientemente del destino (producción de otros bienes y servicios, consumo final de hogares o inversión).
La MIP requiere que los consumos intermedios se clasifiquen de manera idéntica, ya sea en términos de productos o de actividades. Su cálculo proviene de los COU, que para Colombia tienen en las filas los productos5 y en las columnas las ramas de actividad económica6. En la actualidad, el DANE no publica con frecuencia anual la MIP. Esta no hace parte de los cuadros de salida convencionales de las Cuentas Nacionales.
Por esto, es necesario realizar transformaciones en los COU y hacer un tratamiento a las producciones secundarias a través de la aplicación de diferentes modelos teóricos que dependen del tipo de MIP que se quiere analizar (nacional, importaciones y total de la economía) y así encontrar la respectiva producción y generación de ingreso (DANE, 2013).
Para nuestro análisis emplearemos las MIP en su versión actividad-actividad y nacional siguiendo a Sun et al. (2018), Xing et al. (2018), Araújo y Faustino (2017) y McNerney et al. (2013). La MIP actividad-actividad nacional la calculamos para un nivel de desagregación de 61 ramas de actividad.
Las revisiones más recientes de las clasificaciones internacionales de las actividades iniciaron un nuevo ciclo de publicación de las MIP con base en el año 2015 por parte del DANE, quien publicó las MIP para los años 2015 y 2017. No obstante, dada la disponibilidad de solo 2 años de MIP actividad-actividad, el presente trabajo implicó el cálculo de la MIP para los años 2005 a 2021 siguiendo la metodología propuesta por el DANE (2013).
La construcción de la MIP actividad-actividad se fundamenta en un modelo matemático que permite transformar la matriz de consumo intermedio (Ud) del COU sustituyendo las filas que representan productos por actividades. En particular, el modelo que propone el DANE supone que cada producto tiene su propia estructura de ventas7, independientemente de la industria que lo produce (supuesto de estructura de ventas de producto fijo). Lo anterior implica que las proporciones que aporta cada actividad económica en la producción de un producto se mantienen constantes sin importar qué industria lo produzca. Este supuesto permite derivar la MIP directamente de la COU sin hacer definiciones adicionales sobre la producción primaria o secundaria de cada industria (DANE, 2013).
Matricialmente, la matriz de transformación (T) será la matriz de participación de mercado de cada producto
donde: V es la matriz de producción industria-producto que viene del cuadro de oferta y = diag(x) es una matriz en la que la diagonal es la producción por producto que viene del cuadro de utilización.
Finalmente, la MIP actividad-actividad se obtiene multiplicando la matriz de transformación por la matriz de consumo intermedio.
Este proceso fue implementado en R para cada uno de los años en el periodo de estudio (2005 a 2021). En el Anexo 1 se muestran las 61 ramas de actividad económica según el CIIU Rev. 4 A.C que se emplearán en el análisis de este documento.
RESULTADOS
En la Figura 2 se reporta la evolución del diámetro y la densidad de la red implícita en las MIP colombianas de 2005 a 2021. El diámetro creció en el periodo de estudio, lo que implica una mayor cohesión o relación entre las ramas de actividades. El diámetro también aumenta en el periodo de estudio, y muestra una mayor distancia entre las ramas de actividad más alejadas.
Figura 2. Diámetro y densidad de la MIP anual (2005-2021)
Fuente: cálculos de los autores.
Estas dos métricas muestran una red cada vez más interconectada; al mismo tiempo, con distancias más largas entre actividades. Esto podría ser una señal de que la economía colombiana es cada vez más sofisticada, pues cuenta con cadenas de valor cada vez más largas y que incorporan los productos y servicios de más sectores económicos.
Para determinar la estructura inherente a la MIP de la economía colombiana y sus cambios, es necesario identificar las comunidades de actividades para cada año. Empleando los algoritmos intermediación de aristas, modularidad óptima, Walktrap y Spin Glass, encontramos el número de clústeres sugeridos por cada algoritmo y su respectiva modularidad. En la Tabla 1 se reportan los resultados para 2015 y 2021 y en el Anexo 1 y 2 se reportan los resultados para los otros años.
Tabla 1. Modularidad y número de clústeres para cada uno de los algoritmos de detección de comunidades para los años 2005y 2021
Algoritmo |
|
|
||
Modularidad |
Número de |
Modularidad |
Número de |
|
Modularidad óptima |
0,708 |
7 |
0,700 |
7 |
Walktrap |
0,344 |
6 |
0,359 |
4 |
Intermediación de aristas |
0,196 |
49 |
0,223 |
48 |
Spin Glass |
0,001 |
8 |
0,000 |
9 |
Fuente: elaboración de los autores.
Tanto para 2005 como para 2021, el algoritmo de modularidad óptima es el que presenta la modularidad más alta. Este algoritmo sugiere la existencia de 7 comunidades para ambos años. Es más, para los otros 15 años, este mismo algoritmo es el que genera la mayor estructura modular en la red (Anexo 1 y 2). Para la mayoría de los años este algoritmo sugiere 7 comunidades, a excepción de 2013, 2018 y 2019, para los que sugiere 6 comunidades. Para cada uno de los años la modularidad que se alcanza es relativamente alta, rondando valores de 0,7; es decir, se logra una partición de la red en comunidades relativamente buena. Los trabajos de Araújo y Faustino (2017), y Xu y Liang (2019) no reportan si se emplea la modularidad para la selección del número de comunidades. Domínguez et al. (2021) emplean dos algoritmos basados en la modularidad, pero no reportan la modularidad para sus ejercicios.
Los resultados muestran que en la economía colombiana existieron entre 6 y 7 comunidades a lo largo de los años estudiados. En la Figura 3 se muestran cuántas ramas de actividad se asignaron a cada una de las comunidades encontradas por año. Se observa que la distribución es relativamente estable en términos del número de ramas por comunidad de un año a otro; sin embargo, las comunidades 4, 5 y 6 son las que experimentan el mayor cambio en el número de membresías. Por ejemplo, en los años 2018 y 2019 la comunidad 5 no tenía ninguna actividad.
Figura 3. Ramas de actividad por comunidad (2005-2021)
Fuente: cálculos de los autores.
En la Tabla 2 se muestra la lista de las actividades con sus respectivas comunidades para los años 2005, 2010, 2015 y 20218. Los resultados de cada año pueden visualizarse en grafos como la Figura 1, que representa las comunidades de 2015, en donde los colores indican la membresía de las actividades.
Tabla 2. Membrecía a las comunidades de las ramas de actividad económica para los años 2005, 2010, 2015 y 2021
Fuente: elaboración de los autores.
Tabla 2A. Asignación de las ramas de actividad económica a las comunidades encontradas con el algoritmo de mayor modularidad para los años 2005, 2010,2015y 2021
Fuente: cálculos de los autores.
La comunidad 1 corresponde principalmente a actividades agrícolas; la comunidad 2 corresponde a actividades extractivas de madera, minerales metálicos, junto a actividades de fabricación de productos metalúrgicos básicos, muebles de madera y edificaciones; la comunidad 3 corresponde a la extracción, refinación y distribución de fuentes de energía y el transporte aéreo y terrestre. Estas tres comunidades se mantienen entre los años.
Por otra parte, en 2005 la comunidad 4 correspondía a actividades manufactureras del sector textil, curtido de cueros, fabricación de papel, plásticos y sustancias químicas; la comunidad 5 contiene actividades de fabricación de vehículos y maquinaria; la comunidad 6 corresponde a otras industrias manufactureras y actividades de salud; la comunidad 7 está constituida por actividades de servicios. La mayoría de estas actividades se ubican en la comunidad 5 en el 2021, por lo que siguen estando juntas.
En la Figura 4 se pueden visualizar los cambios de membresías de las ramas de actividad año tras año. Las comunidades 1, 2 y 3 son muy estables, mientras que las comunidades 4, 5, 6 y 7 tienen cambios. Los mayores cambios se presentan en 2020, lo cual coincide con la emergencia sanitaria por covid-19; sin embargo, en 2021 las comunidades se configuran de manera similar a 2019. Además de esto, entre 2013 y 2014 se presentan movimientos entre las comunidades 4 y 7, específicamente las actividades de fabricación de papel y actividades de impesión, cambio que se revirtió el año siguiente.
Figura 4. Cambios de actividades entre comunidades de un año a otro (2005-2021)
Nota: el tamaño de flujo de una caja a otra representa el número de ramas que cambiaron de una comunidad a
otra en un año. Por ejemplo, la línea azul clara que pasa de la caja cuatro de
la columna de 2013 a la caja siete de la columna 2014, representa un desplazamiento de ramas de la comunidad 4 a la 7 entre 2013 y 2014.
Fuente: cálculos de los autores.
Según las métricas de estabilidad de un año a otro de la comunidades (H, C, VM, RI y ARI) no se presentan grandes cambios en la estructura de la red (Figura 5); todas las medidas se mantienen por encima de 0,90, lo que indica una alta estabilidad en el corto plazo. Se evidencia un cambio sustancial entre los años 2020 y 2021, probablemente debido al choque de la emergencia sanitaria del covid-19. No obstante la caída en los indicadores, estos siguen tomando valores relativamente altos entre 2021 y 2020, lo cual no permite afirmar que existan fuertes cambios en la estructura de las membresías a las comunidades.
Figura 5. Métricas de estabilidad de las comunidades año a año (2006-2021)
Nota: se compara un año con
respecto al año inmediatamente anterior; por ejemplo, las membrecías a las
comunidades de 2006 se comparan con respecto
a 2005, y la métrica de estabilidad resultante se registra para 2006.
Fuente: cálculos de los autores.
Las métricas que se presentan en la Figura 5 están midiendo el cambio en las comunidades de un año a otro. Es decir, estas medidas son de cambio en el corto plazo. Para capturar cambios que ocurren en periodos más largos, procedemos a comparar los años 2010, 2015 y 2020 con el año que corresponda a 5 años atrás (Figura 6). Al comparar estas redes en el mediano plazo (5 años) se encuentra un cambio levemente más grande al comparar 2010 y 2020 con respecto a 2015. Las métricas calculadas bajan de 0,9, indicando un cambio relativamente bajo en las membresías de las actividades durante estos periodos. El valor de estos indicadores no es suficientemente bajo para afirmar que exista un cambio estructural en la economía colombiana en esos periodos de 5 años.
Figura 6. Métricas de estabilidad con respecto a 5 años atrás (2010, 2015,2020)
Nota: se compara un año con respecto a cinco años atrás; por ejemplo, las membrecías a las comunidades de 2010 se comparan con respecto al 2005 y la métrica de estabilidad resultante se registra para el 2010.
Fuente: cálculos de los autores.
Así como en el ejercicio anterior, en la Figura 7 se puede visualizar el flujo de sectores para estos periodos de 5 años. Los resultados evidencian que sí hay cambios en las comunidades de la red que refleja las interconexiones implícitas en las MIP de la economía colombiana durante el periodo 2005-2020; pero estos cambios no son sustanciales, de manera que no se puede afirmar que existan fuertes cambios estructurales; al menos desde un punto de vista de comunidades.
Figura 7. Flujo de ramas de actividad económica entre comunidades cada 5 años (2005, 2010,2015, 2020)
Nota: el tamaño de un
flujo de una caja a otra representa el número de ramas que cambiaron de una
comunidad a otra. Por ejemplo, la línea azul clara que pasa de la caja 4 de la columna de 2005 a la caja 2 de la columna de 2010 representa un
desplazamiento de ramas de la comunidad 4 a la 2 entre 2005 y 2010.
Fuente: cálculos de los autores.
COMENTARIOS FINALES
Las MIP del SCN implican una red de interconexiones entre las ramas de actividad económica que pueden ser analizadas con herramientas de la teoría de redes. Empleando estas herramientas y una base de datos de MIP para los años de 2005 a 2022, construida por los autores de este estudio, se encuentran resultados interesantes para Colombia.
El análisis de la evolución de la densidad y el diámetro de la red muestra que la economía colombiana está cada vez más interconectada y presenta cadenas de valor más largas, lo cual sugiere una mayor sofisticación del aparato productivo que incorpora más sectores económicos.
Se encontraron entre 6 y 7 comunidades de ramas de actividad económica para el periodo de estudio. Estas son actividades agrícolas; actividades extractivas y construcción, extracción, refinación y distribución de fuentes de energía; actividades manufactureras; actividades de fabricación de vehículos y maquinaria; otras industrias manufactureras; actividades de salud, y actividades de servicios como información y comunicaciones.
En el análisis de corto plazo se evidenciaron cambios leves en la estructura de la economía colombiana especialmente en el año 2008, 2013, 2017 y 2020. Estos cambios parecen coincidir con choques exógenos en la economía, la posible causalidad entre estos debería ser estudiada en una futura investigación. Los cambios en la estructura de la economía colombiana son un poco más evidentes en un análisis de mediano plazo (periodos de 5 años), donde se ven cambios del año 2010 al 2015 y del 2015 al 2020.
Los resultados evidencian que sí hay cambios en la red de interconexiones que se reflejan en la MIP de la economía colombiana durante el periodo 2005-2021, pero no son sustanciales, de manera que no se puede afirmar que existan fuertes cambios estructurales, al menos desde un punto de vista de comunidades.
Además del análisis de la economía colombiana, este trabajo aporta a la literatura en varios frentes. En primer lugar, se construyeron las MIP para el periodo 2005-2021 a partir de los cuadros oferta-utilización publicados por el DANE9.
En segundo lugar, este documento presenta una aproximación metodológica que puede aplicarse para analizar las cuentas nacionales de otros países, ningún aspecto de la metodología empleada aquí es específico para el caso colombiano. Además, los resultados de los análisis de redes podrían no solo emplearse para caracterizar las relaciones entre las ramas de actividad de la estructura productiva de un país, sino también para predecir sus tendencias y cambios futuros. Por ejemplo, para los inversionistas en un país, la identificación de la tendencia de una rama de actividad en términos de su puntaje de autoridad puede representar una oportunidad de crecimiento, ya sea porque está comprando o vendiendo más. Asimismo, para las políticas económicas, el reconocimiento de cuáles son las actividades más críticas para mantener la estabilidad de la red económica permite tomar medidas para proteger y fomentar su desarrollo.
Finalmente, hasta donde llega el conocimiento de los autores, los análisis de estabilidad no se han intentado anteriormente en el contexto del análisis de redes. Todo lo anterior fue aplicado por primera vez al caso colombiano en un periodo de estudio extenso. En esta línea, se sugiere que futuras investigaciones analicen la causalidad entre eventos y los cambios coyunturales encontrados en la estructura económica colombiana, la exploración de otros periodos de estudio y otras metodologías para detectar cambios estructurales en redes. Así mismo, es importante explorar otro tipo de técnicas para detectar comportamiento anómalos en redes que podrían ser útiles para detectar cambios estructurales en las redes implícitas de las MIP.
AGRADECIMIENTOS Y CONTRIBUCIONES
Agradecemos a los evaluadores por sus observaciones y sugerencias, las cuales contribuyeron a mejorar nuestro trabajo. Así mismo, agradecemos a la Universidad Icesi y al Cienfi por la financiación interna y el tiempo asignado para llevar a cabo esta investigación. En esta investigación solo se emplearon datos secundarios, por lo que no se requirió la aprobación de un comité de ética. No se presentó interacción directa con sujetos humanos ni se recopilaron datos identificables. Por otro lado, declaramos que no existe ningún conflicto de interés en relación con esta investigación. Los resultados presentados son imparciales y no están influenciados por intereses financieros o personales. Julio César Alonso participó en las siguientes actividades: supervisión, conceptualización, metodología, validación, redacción del borrador inicial, revisión y edición. María Paula Ocampo participó en las siguientes actividades: conceptualización, metodología, recopilación de datos, análisis formal, redacción del borrador inicial, visualización, revisión y edición.
Notas
1 Las MIP para el periodo 2005-2021 están disponibles en: https://www.icesi.edu.co/centros-academicos/analisis/matrices-insumo-producto-2005-2020-metodologia-dane-calculos-cienfi.
2 En una versión anterior de este documento se empleó como criterio de selección del número de comunidades la silueta promedio, pero no funcionó bien. Solo se detectaban dos grupos, uno con una rama de actividad y el otro con las demás; una explicación para esto puede ser la existencia de transacciones (aristas) atípicas (Batool & Hennig, 2021). Por razones de espacio, no se hará referencia al uso de la silueta.
3 En una versión anterior de este documento se consideraron algoritmos tradicionales de clústering jerárquicos (Simple, Completa, Media, Mediana, Centroide, McQuitty y Ward), no jerárquicos (k-medias, k-medianas, FANNY, PAM, CLARA y DBSCAN) y el método de inteligencia artificial SOM (Self Organizing Map). Así como distancias euclidiana y Manhattan. En ninguno de esos casos se obtienen mejores resultados que empleando los algoritmos de construcción de comunidades. Así, por razones de espacio se restringe la discusión a los algoritmos de construcción de comunidades.
4 Para una descripción detallada de este indicador ver Rosenberg & Hirschberg (2007)
5 El DANE clasifica los productos de acuerdo con la clase CPC Vers. 2 A.C. El máximo nivel de desagregación es de 392 productos.
6 El DANE clasifica las ramas de actividad de acuerdo con la clase CIIU Rev. 4 A.C. El máximo nivel de desagregación implica 61 ramas de actividad.
7 7 El término "estructura de ventas" se refiere a la proporción de cada producto que se utiliza para consumo intermedio y para uso final.
8 Es posible solicitar a los autores una lista detallada de las membresías en todos los años. Por razones de espacio no se incluye dicha lista en este documento.
9 Esta implementación y sus resultados están disponibles en: https://www.icesi.edu.co/centros-academicos/analisis/matrices-insumo-producto-2005-2020-metodologia-dane-calculos-cienfi.
REFERENCIAS
1. Acemoglu, D., Carvalho, V., Ozdaglar, A., & Tahbaz-Salehi, A. (2012). The Network Origins of Aggregate Fluctuations. Econometrica, 80(5), 1977-2016. https://doi.org/10.3982/ECTA9623
2. Alonso, J., & Carabali, J. A. (2019). Breve tutorial para visualizar y calcular métricas de redes (grafos) en R (para Económistas). Universidad Icesi.
3. Araújo, T, & Faustino, R. (2017). The topology of inter-industry relations from the Portuguese national accounts. Physica A: Statistical Mechanics and its Applications, 479, 236-248. https://doi.org/10.1016/j.physa.2017.03.018
4. Aroche-Reyes, F. (2003). A qualitative input-output method to find basic economic structures. Papers in Regional Science, 82, 581-590. https://doi.org/10.1007/S10110-003-0149-Z
5. Barro, R. J., & Sala-i-Martin, X. (1992). Convergence. Journal of Political Economy, 100(2), 223251. https://doi.org/10.1086/261816
6. Batool, F., & Hennig, C. (2021). Clustering with the average silhouette width. Computational Statistics & Data Analysis, 158, 107190. https://doi.org/10.1016/jxsda.2021.107190
7. Battiston, S., Rodrigues, J., & Zeytinoglu, H. (2005). The network of inter-regional direct investment stocks across Europe. Advances in Complex Systems, 10, 29-51. https://doi.org/10.1142/S0219525907000933
8. Baumol, W. (2000a). What Marshall didn't know: On the twentieth century's contributions to economics. The Quarterly Journal of Economics, 115(Issue 1), 1-44, https://doi.org/10.1162/003355300554656
9. Baumol, W. (2000b). Leontief's great leap forward: Beyond Quesnay, Marx and von Bortkiewicz. Economic Systems Research, 12(2), 141-152. https://doi.org/10.1080/09535310050005662
10. Beaton, M. K., Cebotari, A., Ding, X., & Komaromi, A. (2017). Trade integration in Latin America: A network perspective. IMF Working Papers. https://doi.org/10.2139/ssrn.3014078
11. Beygelzimer A, Kakadet S, Langford J, Arya S, Mount D, & Li S (2024). _FNN: Fast Nearest Neighbor Search Algorithms and Applications. R package version 1.1.4, https://CRAN.R-project.org/package=FNN.
12. Blanco, G. (2017). Indice de complejidad económica para los departamentos de Colombia, evolución 2012-2015. Working paper. Facultad de Ciencias Económicas, Universidad Nacional de Colombia. https://repositorio.unal.edu.co/bitstream/handle/unal/63203/1015428688.2017.pdf?sequence=1
13. Brandes, U., Delling, D., Gaertler, M., Gorke, R., Hoefer, M., Nikoloski, Z., & Wagner, D. (2008). On modularity clustering. IEEE Transactions on Knowledge and Data Engineering, 20(2), 172-188. https://doi.org/10.1109/TKDE.2007.190689
14. Charrad, M., Ghazzali, N, Boiteau, V., & Niknafs A. (2014). NbClust: An R Package for determining the relevant number of clusters in a data set. Journal of Statistical Software, 61 (6), 1-36. URL http://www.jstatsoft.org/v61/i06/
15. Clemente, G., & Cornaro, A. (2019). A novel measure of edge and vertex centrality for assessing robustness in complex networks. Soft Computing, 24, 13687-13704. https://doi.org/10.1007/s00500-019-04470-w
16. Contreras, M. G. A., & Fagiolo, G. (2014). Propagation of economic shocks in input-output networks: A cross-country analysis. Physical Review E, 90(6), 062812. https://doi.org/10.1103/PhysRevE.90.062812
17. Csardi, G., & Nepusz, T. (2006). The igraph software package for complex network research. InterJournal, Complex Systems, 1695. https://igraph.org
18. DANE (2013). Metodología de la matriz insumo-producto (MIP). https://www.dane.gov.co/files/investigaciones/pib/especiales/metodologia_matriz_insumo_producto_07_13.pdf
19. DANE (2020). Revisión 4 adaptada para Colombia C11U Rev. 4 A.C. (2020). https://www.dane.gov.co/files/sen/nomenclatura/ciiu/CIIU_Rev_4_AC2020.pdf
20. DePaolis, F., Murphy, P., & De Paolis M. C. (2022). Identifying key sectors in the regional economy: A network analysis approach using input-output data. Research Square. https://doi.org/10.21203/rs.3.rs-1666449/v1
21. Ding, J., & Lu, Y. (2015). Control backbone: An index for quantifying a node's importance for the network controllability. Neurocomputing, 153, 309-318. https://doi.org/10.1016/j.neucom.2014.11.024
22. Domínguez, A., Santos-Marquez, F., & Mendez, C. (2021). Sectoral productivity convergence, input-output structure and network communities in Japan. Structural Change and Economic Dynamics, 59, 582-599. https://doi.org/10.1016/j.strueco.2021.10.012
23. Dotta, V. (2021). Propagación de shocks económicos a través de redes insumo-producto: una aplicación para los países de América del Sur [Tesis de maestría]. Universidad de la República (Uruguay). Facultad de Ciencias Económicas y de Administración. https://hdl.handle.net/20.500.12008/31136
24. Drejer, I. (2000). Comparing patterns of industrial interdependence in national systems of innovation - A study of Germany, the United Kingdom, Japan and the United States. Economic Systems Research, 12, 377-399. https://doi.org/10.1080/09535310050120943
25. Fagiolo, G., Reyes, J., & Schiavo, S. (2008). On the topological properties of the world trade web: A weighted network analysis. Physica A: Statistical Mechanics and its Applications, 387(15), 3868-3873. https://doi.org/10.1016/j.physa.2008.01.050
26. Galili, T (2015). Dendextend: An R package for visualizing, adjusting, and comparing trees of hierarchical clustering. Bioinformatics. https://doi.org/0.1093/bioinformatics/btv428
27. García, A. (2013). Modelling linkages versus leakages networks: The case of Spain. Regional and Sectoral Economic Studies, 13, 43-54. https://pubs.acs.org/doi/suppl/10.1021/acs.est.5b05094/suppl_file/es5b05094_si_001.pdf
28. García, A., Morillas, A., & Ramos, C. (2008). Key sectors: A new proposal from network theory. Regional Studies, 42(7), 1013-1030. https://doi.org/10.1080/00343400701654152
29. Giuliani, E. (2013). Network dynamics in regional clusters: Evidence from Chile. Research Policy, 42, 1406-1419. https://doi.org/10.1016/XRESPOL.2013.04.002
30. Graham, B., & De Paula, A. (2020). The econometric analysis of network data. Academic Press. https://doi.org/10.1920/wp.cem.2020.420
31. Granovetter, M. (1978). Threshold models of collective behavior. American Journal of Sociology, 83(6), 1420-1443. https://doi.org/10.1086/226707
32. Ghosh, S., & Roy, J. (1998). Qualitative input-output analysis of the indian economic structure. Economic Systems Research, 10(3), 263-274. https://doi.org/10.1080/762947111
33. Guo, J., & Planting, M. A. (2000). Using input-output analysis to measure US economic structural change over a 24 year period. BEA Papers 0004, Bureau of Economic Analysis. https://www.bea.gov/system/files/papers/WP2000-1.pdf
34. Hausmann, R., & Hidalgo, C. A. (2011). The network structure of economic output. Journal of Economic Growth, 16, 309-342. https://doi.org/10.1007/s10887-011-9071-4
35. Hewings, G. J. D. (1982). The empirical identification of key sectors in an economy: A regional perspective. The Developing Economies, 20(2), 173-195. https://doi.org/10.1111/j.1746-1049.1982.tb00444.x
36. Hidalgo, C. A., & Hausmann, R. (2010). Inferring macroeconomic complexity from country-product network data. AAAI Spring Symposium: Artificial Intelligence for Development. https://cdn.aaai.org/ocs/1183/1183-5889-1-PB.pdf
37. Hidalgo, C. A., Klinger, B., Barabási, A. L., & Hausmann, R. (2007). The product space conditions the development of nations. Science, 317(5837), 482-487. https://doi.org/10.1126/science.1144581
38. Hirschman, A. O. (1958). The Strategy of Economic Development. Yale University Press.
39. Holub, H., & Schnabl, H. (1985). Qualitative input-output analysis and structural information. Economic Modelling, 2, 67-73. https://doi.org/10.1016/0264-9993(85)90010-0
40. Iori, G., Masi, G., Precup, O., Gabbi, G., & Caldarelli, G. (2008). A network analysis of the Italian overnight money market. Journal of Economic Dynamics and Control. https://doi.org/10.1016ZJ.JEDC.2007.01.032
41. Jankowska, A., Nagengast, A., & Perea, J. (2012). The product space and the middle-income trap: Comparing Asian and Latin American experiences. OECD Development Centre Working Papers, (311), OECD Publishing. https://doi.org/10.1787/5k9909j2587g-en
42. Jorgenson, D. W. (2016). Econometric general equilibrium modeling. Journal of Policy Modeling, 38(3), 436-447. https://doi.org/10.1016/j.jpolmod.2016.02.004
43. König, M., Battiston, S., Napoletano, M., & Schweitzer, F. (2008). On algebraic graph theory and the dynamics of innovation networks. Networks and Heterogeneous Media. https://doi.org/10.3934/NHM.2008.3.201
44. Laumas, P S. (1975). Key sectors in some underdeveloped countries. Kyklos, 28(1). https://doi.org/10.1111/j.1467-6435.1975.tb01934.x
45. An, W., & Liu, Y (2023). _Keyplayer: Locating key players in social networks. R package version 1.0.4. https://CRAN.R-project.org/package=keyplayer
46. Lora, E. (2021). Forecasting formal employment in cities. Revista de Economía del Rosario, 24(1), 1-38. https://doi.org/10.12804/revistas.urosario.edu.co/economia/a.10029
47. Lora, E., & Prada, S. I. (2023). Técnicas de medición económica: metodología y aplicaciones en Colombia (6.a ed.). Editorial Universidad Icesi. https://doi.org/10.18046/EUI/tme.6
48. Lorenz, J., Battiston, S., & Schweitzer, F. (2009). Systemic risk in a unifying framework for cascading processes on networks. The European Physical Journal B, 71, 441-460. https://doi.org/10.1140/epjb/e2009-00347-4
49. Maechler, M., Rousseeuw, P., Struyf, A., Hubert, M., Hornik, K. (2022). Cluster Analysis Basics and Extensions. R package version 2.1.5. https://CRAN.R-project.org/package=cluster
50. McNerney, J., Fath, B. D., & Silverberg, G. (2013). Network structure of inter-industry flows. Physica A: Statistical Mechanics and its Applications, 392(24), 6427-6441. https://doi.org/10.1016/j.physa.2013.07.063
51. Miller, R. E., & Blair, P. D. (2009). 1nput-output analysis: Foundations and extensions (2nd ed.). Cambridge University Press.
52. Montresor, S., & Marzetti, G. V. (2009). Applying social network analysis to input-output based innovation matrices: An illustrative application to six OECD technological systems for the middle 1990s. Economic Systems Research, 21 (2), 129-149. https://doi.org/10.1080/09535310902940228
53. Myers, C. A., & Shultz, G. P (1951). The Dynamics of a Labor Market: A Study of the Impact of Employment Changes on Labor Mobility, Job Satisfactions, and Company and Union Policies. Prentice-Hall.
54. Newman, M. E. J., & Girvan, M. (2002). Mixing patterns and community structure in networks. arXiv: Statistical Mechanics of Complex Networks (pp. 66-87). Springer. https://doi.org/10.1007/978-3-540-44943-0_5
55. Newman, M. E. J., & Girvan, M. (2004). Finding and evaluating community structure in networks. Physics Review E, 69, 026113. https://doi.org/10.1103/PhysRevE.69.026113
56. Niño, J. O. P. (2020). Detección de comunidades en redes: algoritmos y aplicaciones. https://arxiv.org/pdf/2009.08390.
57. O'Clery, N., Curiel, R. P, & Lora, E. (2019). Commuting times and the mobilisation of skills in emergent cities. Applied Network Science, 4(1), 1-27. https://doi.org/10.1007/s41109-019-0235-z
58. Pons, P., & Latapy, M. (2005). Computing communities in large networks using random walks. Computer and Information Sciences ISCIS 2005. Springer. https://doi.org/10.1007/11569596_31
59. Rasmussen, P N. (1956). Studies in Inter-Sectoral Relations. E. Harck.
60. Reichardt, J., & Bornholdt, S. (2006). Statistical mechanics of community detection. Physical Review E, 74(1). https://doi.org/10.1103/PhysRevE.74.016110
61. R Core Team (2023). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing. https://www.R-project.org/.
62. Rosenberg, A., & Hirschberg, J. (2007). V-measure: A conditional entropy-based external cluster evaluation measure. Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning (EMNLP-CoNLL) (pp. 410420). Association for Computational Linguistics. https://aclanthology.org/D07-1043
63. Santos, J. M., & Embrechts, M. (2009). On the use of the adjusted rand index as a metric for evaluating supervised classification. Artificial Neural Networks-ICANN 2009: 19th International Conference, Limassol, Cyprus, September 14-17, 2009, Proceedings, Part 11 19 (pp. 175-184). Springer. https://doi.org/10.1007/978-3-642-04277-5_18
64. Schnabl, H. (1994). The evolution of production structures, analyzed by a multi-layer procedure. Economic Systems Research, 6, 51-68. https://doi.org/10.1080/09535319400000004
65. Schultz, S. (1977). Approaches to identifying key sectors empirically by means of input-output analysis. The Journal of Development Studies, 14(1), 77-96. https://doi.org/10.1080/00220387708421663
66. Slater, P (1977). The determination of groups of functionally integrated industries in the United States using a 1967 interindustry flow table. Empirical Economics, 2, 1-9. https://doi.org/10.1007/BF01764717
67. Slater, P (1978). The network structure of the United States input-output table. Empirical Economics, 3, 49-70. https://doi.org/10.1007/BF01764564
68. Sonis M., & Hewings, G. J. (1998). Economic complexity as network complication: Multiregional input-output structural path analysis. The Annals of Regional Science, 32, 407-436. https://doi.org/10.1007/S001680050081.
69. Sun, X., An, H., & Liu, X. (2018). Network analysis of Chinese provincial economies. Physica A: Statistical Mechanics and its Applications, 492, 1168-1180. https://doi.org/10.1016/j.physa.2017.11.045
70. Tsekeris, T (2017). Network analysis of inter-sectoral relationships and key sectors in the Greek economy. Journal of Economic Interaction and Coordination, 12, 413-435. https://doi.org/10.1007/s11403-015-0171-7
71. Wasserman, S., & Faust, K. (1994). Social network analysis: Methods and applications. Cambridge University Press.
72. Wickham, H., Averick, M., Bryan, J., Chang, W., McGowan, L. D., François, R., ... Yutani, H. (2019). Welcome to the tidyverse. Journal of Open Source Software, 4(43), 1686. https://doi.org/10.21105/joss.01686.
73. Xing, L., Guan, J., & Wu, S. (2018). Measuring the impact of final demand on global production system based on Markov process. Physica A: Statistical Mechanics and its Applications, 502, 148163. https://doi.org/10.1016/j.physa.2018.02.129
74. Xu, M., & Liang, S. (2019). Input-output networks offer new insights of economic structure. Physica A-statistical Mechanics and Its Applications, 527, 121178. https://doi.org/10.1016/J.PHYSA.2019.121178
75. Zhou, M., Wu, G., & Xu, H. (2016). Structure and formation of top networks in international trade, 2001-2010. Social Networks, 44, 9-21. https://doi.org/10.1016/j.socnet.2015.07.006
Anexos
Anexo 1. Código y nombre de las actividades según CIIU Rev. 4 A.C. empleadas en la construcción de la MIP y el análisis de redes
Fuente: Nomenclatura Actividades y Productos (DANE, 2022).
Anexo 2. Modularidad y número de clústeres para cada uno de los algoritmos de detección de comunidades para los años 2006 a 2014
Anexo 3. Modularidad y número de clústeres para cada uno de los algoritmos de detección de comunidades para los años 2015 a 2020
Creative Commons Atribución-NoComercial- CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)