KNN или K-средства для уменьшения размерности признаков? - PullRequest
0 голосов
/ 07 ноября 2019

Сократите количество функций / получите представление о том, как каждая страна работает в данной категории.

  • Категории здесь будут создаваться на основеуже существующие функции.

  • Набор данных, состоящий примерно из 80 стран, по 52 сериям / функциям (ВВП, экспорт, LPI и т. д.), за 20 лет.

  • Некоторые страны имеют более полную информацию, чем другие, некоторые функции имеют более полную информацию, чем другие.

  • Функции не обязательно разделяютсята же шкала! (Например: ВВП может быть в миллионах, тогда как LPI составляет только 1-5)

Попытка создатьнесколько новых функций, которые инкапсулируют 52 существующих функции, а затем назначают буквенные оценки странам для каждой из новых функций X.

В настоящее время не сосредоточены на аспекте временных рядов этого,но в конечном итоге захотим отслеживать оценки каждой страны для данной категории с течением времени.

Я думал об использовании Kmeans или KNN для создания новых функций(?)

Является ли это наилучшим способом уменьшения количества проверяемых функций / обобщения информации из них?

Возможно ли это даже с учетом проблемы масштабируемости?

ОТ

[Country  Year  Feature_1  Feature_2  Feature_3 ...]

USA  2001  GDP  Exports  LPI  ...

USA  2002  GDP  Exports  LPI  ...

USA  2003  GDP  Exports  LPI  ...


UK  2001  GDP  Exports  LPI  ...

UK  2002  GDP  Exports  LPI  ...

UK  2003  GDP  Exports  LPI  ...

...

ДО

[Country  Year  New_Feature_X]

USA  2001  A
USA  2002  A
USA  2003  B+

UK  2001  B
UK  2002  B+
UK  2003  B

...

Где новая функция X суммирует несколько предыдущих функций в ONE .

Inв этом случае, что New_feature будет что-то вроде «финансы» или «кросс-коммерческий класс» и т. д.

Я ошибаюсь, думая, что есть способ избежать создания этих 'новыхфункции «вручную»?

Я знаю, что здесь есть потенциальные проблемы с масштабируемостью, но это все еще кажется самым простым способом уменьшить эту размерность ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...