Создание классов / кластеров многомерных данных с помощью машинного обучения - PullRequest
0 голосов
/ 26 января 2019

У меня следующий вопрос: я изучаю данные в Управлении воздушным движением, и здесь интересна связь между погодой и задержками рейсов. Для этого существуют специальные метрики погоды (например, классификация морозов от 1 до 10 или ветра от 1 до 10), за которыми охватываются определенные области явления погоды. Прогнозирование задержек с использованием этих значений погоды очень хорошо работает с LSTM под TensorFlow.

Однако я хотел бы критически оценить категории погоды, поскольку эти значения от 1 до 10 устанавливаются очень произвольно. Имеет ли смысл решать это как проблему кластеризации (например, kMean) с учетом данных о полетах и ​​задержках? Или вы бы предпочли указать классы (например, также 10) и применить контролируемую классификацию? Речь идет о 6 погодных особенностях (мороз, ветер и т. Д.), Для которых должны быть созданы классы различных воздействий на задержку (например, класс от 1: 0 до 10kt ветра, класс от 2: 10 до 25kt, ...).

Заранее спасибо!

Reiti

...