Как «настроить» набор данных так, чтобы общая сумма была равна 1. (Я думал, что знал правильный термин для этого) - PullRequest
0 голосов
/ 07 сентября 2018

Я заранее прошу прощения за грубую формулировку этого вопроса.У меня было самое долгое время впечатление, что то, что я пытаюсь сделать, называется «Нормализация данных», но после поиска в Google, чтобы попытаться найти метод, чтобы сделать это, я, кажется, ошибаюсь, поэтому я не уверен, что именнозвонил, что я пытаюсь сделать (потерпите меня, пожалуйста).

У меня есть такой набор данных:

0.17407
0.05013
0.08520
0.02892
0.02986
0.06286
0.04453
0.00425
0.20470
0.02267
0.01470
0.02460
0.01735
0.01069
0.02168
0.13912
0.02004
0.02018
0.07837

Когда вы добавляете их все, вы получаете 1.05392.

Я бы хотел «настроить» набор данных так, чтобы все относительные значения оставались одинаковыми, но сумма была равна 1. Когда я прибегнул к нормализации наборов данных, я нашел формулу, подобную этой:

(x-min(x))/(max(x)-min(x))

Однако это просто «ранжирует» каждую точку данных как определенный процент от максимального значения, так что ваше максимальное значение в вашем наборе данных равно 1, а минимальное - 0.

Дополнительно: может ли кто-нибудь просветить меня, как это называется, если не нормализовать данные.Очевидно, я слишком долго носил эту невежественную веру.

1 Ответ

0 голосов
/ 07 сентября 2018

Если вы хотите, чтобы ваши данные суммировались с 1, вы нормализуете свои данные. Вы нормализуетесь путем деления на сумму ваших рядов (sum_i x_i, где x_i - элементы вашего ряда данных).

Упомянутая вами формула является еще одним возможным изменением масштаба, но, как вы заметили, она имеет другой эффект. Обратите внимание, что в первом случае вы отображаете x -> c*x (в вашем случае: x -> 1/1.05392*x), в то время как во втором случае масштабируется с x -> c*x + offset. Также обратите внимание, что последнее не является линейным (если не min(x) = 0), то есть f(x+y) != f(x) + f(y).

Если все ваше заблуждение связано с наименованием вещей, то я бы не стал сильно волноваться. В конце концов, существует только соглашение и общее согласие, но нет абсолютной правды / авторитета. И термины повторно используются в разных областях, ср. Нормализация в Википедии :

Нормализация или нормализация относится к процессу, который делает что-то более нормальное или регулярное

...