У меня есть два CSV-файла, содержащие страны и значения, соответствующие каждой стране. Данные из CSV 1 показывают, сколько раз страна подверглась нападению на своей собственной земле. Данные из CSV 2 обозначают количество раз, когда страна атаковала другую страну за границей. Эти два набора данных частично совпадают, и я намерен продемонстрировать значения из обоих наборов данных в одном диапазоне серой шкалы для отображения на карте хороплетов.
У меня есть некоторые (очевидно) поддельные данные ниже, чтобы продемонстрировать, что Я работаю с.
TARGET.csv
country, code, value
Iran, IRN, 5
Russia, RUS, 4
United States, USA, 0
Egypt, EGY, 2
Spain, ESP, 1
ATTACKER.csv
country, code, value
Iran, IRN, 3
Russia, RUS, 9
United States, USA, 4
Egypt, EGY, 0
Spain, ESP, 0
Есть больше целей, чем атакующих. Я хочу обеспечить точное представление данных, но не знаю, как бы я создал нормализованный диапазон значений от -1 до 1. Насколько я понимаю, отображение данных таким образом будет точно представлять реальность лучше, но я чувствую, что могу ошибаться.
В итоге:
1) Правильно ли я думаю об этой проблеме? Правильный ли это способ отображения данных?
2) Какой язык используется для описания моего вопроса? Обычно я в состоянии разобраться в этих вещах, но я зашел в тупик поисковых запросов.
3) Как мне убедиться, что мой диапазон нормализован. Обратите внимание, что вышеупомянутые США выглядят как единственный нападающий, который никогда не был целью. Может ли это сделать США ближайшим значением +1, несмотря на большее количество атак в России?
Я был бы признателен за любой вклад, который вы все можете предложить. .