Расчет примеси Джини вектора в R - PullRequest
0 голосов
/ 14 февраля 2019

Я работаю над проблемой в R и пытаюсь вычислить индекс Джини как часть проблемы двоичной классификации, первоначально для вектора, где все значения различны.Я немного озадачен, поскольку ожидаю получить результат 1 для идеального неравенства, однако, используя функции Джини, я получаю разные результаты, например, с помощью функции Gini() из библиотеки DescTools:

samplevector <- c(0:20)
Gini(samplevector)
[1] 0.3666667

Что мне здесь не хватает?

1 Ответ

0 голосов
/ 14 февраля 2019

Вам не хватает того, что рассчитывает индекс Джини.В вашем примере вы даете вектор доходов, который не является полностью неравным в смысле индекса Джини.Если вам нужен индекс 1:

samplevector <- c(rep(0,100),100)
Gini(samplevector)

[1] 1

Здесь samplevector - это абсолютно неравное распределение доходов: кто-то обладает всем, все остальные - ничем.Наоборот:

samplevector <- c(rep(100,100))
Gini(samplevector)

[1] 8.760354e-18

Здесь у всех одинаковый доход, а индекс Джини равен почти 0. В вашем примере у вас есть промежуточная ситуация.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...