Сократите количество функций / получите представление о том, как каждая страна работает в данной категории.
Категории здесь будут создаваться на основеуже существующие функции.
Набор данных, состоящий примерно из 80 стран, по 52 сериям / функциям (ВВП, экспорт, LPI и т. д.), за 20 лет.
Некоторые страны имеют более полную информацию, чем другие, некоторые функции имеют более полную информацию, чем другие.
Функции не обязательно разделяютсята же шкала! (Например: ВВП может быть в миллионах, тогда как LPI составляет только 1-5)
Попытка создатьнесколько новых функций, которые инкапсулируют 52 существующих функции, а затем назначают буквенные оценки странам для каждой из новых функций X.
В настоящее время не сосредоточены на аспекте временных рядов этого,но в конечном итоге захотим отслеживать оценки каждой страны для данной категории с течением времени.
Я думал об использовании Kmeans или KNN для создания новых функций(?)
Является ли это наилучшим способом уменьшения количества проверяемых функций / обобщения информации из них?
Возможно ли это даже с учетом проблемы масштабируемости?
ОТ
[Country Year Feature_1 Feature_2 Feature_3 ...]
USA 2001 GDP Exports LPI ...
USA 2002 GDP Exports LPI ...
USA 2003 GDP Exports LPI ...
UK 2001 GDP Exports LPI ...
UK 2002 GDP Exports LPI ...
UK 2003 GDP Exports LPI ...
...
ДО
[Country Year New_Feature_X]
USA 2001 A
USA 2002 A
USA 2003 B+
UK 2001 B
UK 2002 B+
UK 2003 B
...
Где новая функция X суммирует несколько предыдущих функций в ONE .
Inв этом случае, что New_feature будет что-то вроде «финансы» или «кросс-коммерческий класс» и т. д.
Я ошибаюсь, думая, что есть способ избежать создания этих 'новыхфункции «вручную»?
Я знаю, что здесь есть потенциальные проблемы с масштабируемостью, но это все еще кажется самым простым способом уменьшить эту размерность ...