Árbol de decisión del índice de Gini

Estoy calculando el coeficiente de Gini (similar a: Python – Cálculo del coeficiente de Gini usando Numpy) pero obtengo un resultado extraño. para una distribución uniforme muestreada a partir de np.random.rand(), el coeficiente de Gini es 0,3 pero habría esperado que fuera cercano a 0 (igualdad perfecta). ¿qué está fallando aquí?

Es de esperar. Una muestra aleatoria de una distribución uniforme no da como resultado valores uniformes (es decir, valores relativamente cercanos entre sí). Con un poco de cálculo, se puede demostrar que el valor esperado (en el sentido estadístico) del coeficiente de Gini de una muestra de la distribución uniforme en [0, 1] es 1/3, por lo que obtener valores en torno a 1/3 para una muestra determinada es razonable.

El coeficiente de Gini es el área bajo la curva de Lorence, que suele calcularse para analizar la distribución de la renta en la población. https://github.com/oliviaguest/gini proporciona una implementación sencilla para la misma utilizando python.

Cuando se calculan los coeficientes de Gini directamente a partir de las áreas bajo las curvas con np.traps u otro método de integración, el primer valor de la curva de Lorenz debe ser 0 para que se contabilice el área entre el origen y el segundo valor. Los siguientes cambios en G(v) arreglan esto:

Coeficiente de Gini en Python

El índice de Gini es un intento de expresar la desigualdad que presenta la curva de Lorenz en un solo número. En esencia, es el doble del área entre la curva de igualdad y la curva de Lorenz real. En pocas palabras:

El estimador propuesto por ⊕Osier (2009)Osier, Guillaume. 2009. «Estimación de la varianza para indicadores complejos de pobreza y desigualdad». Journal of the European Survey Research Association 3 (3): 167-95. http://ojs.ub.uni-konstanz.de/srm/article/view/369. se define como:

El paquete R vardpoor (⊕Breidaks, Liberts, y Ivanova 2016Breidaks, Juris, Martins Liberts, y Santa Ivanova. 2016. «Vardpoor: Estimación de indicadores sobre exclusión social y pobreza y su linealización, estimación de la varianza». Riga, Letonia: CSB.), creado por los investigadores de la Oficina Central de Estadística de Letonia, incluye un cálculo del coeficiente de gini utilizando el método de cluster final. El ejemplo siguiente reproduce esas estadísticas.

La estimación de la varianza se calcula utilizando la aproximación definida en (1.1), en la que la variable linealizada \(z\) se define mediante (1.2). Las funciones convey::svygini y vardpoor::lingini producen la misma variable linealizada \(z\).

Índice de Gini por países

ResumenPara superar simultáneamente la limitación del índice de Gini, en el sentido de que es menos sensible a la desigualdad en las colas de la distribución de la renta, y la limitación de los coeficientes interdeciles, que ignoran la desigualdad en la parte media de la distribución de la renta, se introduce un índice de desigualdad. Se compone de tres indicadores, a saber, el índice de Gini, la cuota de ingresos del 10% superior y la cuota de ingresos del 10% inferior. Para demostrar el funcionamiento del índice de desigualdad se utilizan los datos de la base de datos del Banco Mundial y de la base de datos de distribución de la renta de la Organización para la Cooperación y el Desarrollo Económico entre 2005 y 2015. Los resultados muestran que puede distinguir la desigualdad de ingresos entre países que comparten el mismo índice de Gini, pero que tienen diferentes brechas de ingresos entre el 10% superior y el 10% inferior. También puede distinguir la desigualdad de ingresos entre países que tienen la misma proporción de ingresos en el 10% superior y en el 10% inferior, pero que difieren en los valores del índice de Gini. Además, el índice de desigualdad podría captar la dinámica en la que el índice de Gini de un país es estable a lo largo del tiempo, pero la proporción de la cuota de ingresos del 10% superior con respecto a la cuota de ingresos del 10% inferior va en aumento. Además, el índice de desigualdad podría aplicarse a otras disciplinas científicas como medida de heterogeneidad estadística y para distribuciones de tamaño de cualquier cantidad no negativa.

Clasificación del índice de Gini en 2020

El término «coeficiente de Gini» de una nación se refiere a la medición de la distribución de la renta entre la población de la nación. En otras palabras, puede considerarse como la medida de la desigualdad de la distribución de la renta en la sociedad y su valor se sitúa en el rango de 0 y 1, donde el valor de 1 indica un mayor grado de desigualdad de la renta. La fórmula del coeficiente de Gini implica el cálculo de una puntuación agregada que es una función compleja de la contribución a la renta (fracción de la renta) de un segmento diferente de la población (fracción de la población). A continuación, el coeficiente de Gini se calcula deduciendo la puntuación agregada de 1. Matemáticamente, la fórmula del coeficiente de Gini se representa como,

Tomemos un ejemplo sencillo de una población de 20 personas para entender el concepto del coeficiente de Gini. Según la información dada, las primeras 5 personas ganan 50 dólares al mes por persona, las siguientes 10 personas ganan 100 dólares al mes por persona y las últimas 5 personas ganan 300 dólares al mes por persona. Calcula el coeficiente de Gini para la población.

Por Sofía Salome

Hola mundo, soy Sofía Salomé copywriter de Damboats.es