Моделирование предсказателя приливов - PullRequest
0 голосов
/ 14 марта 2019

Я только начинаю изучать модели машинного обучения, такие как линия, регрессия гребня, персептрон, логистическая регрессия, градиентный спуск, и я не понимаю, как какую-либо из этих моделей можно использовать для решения этой проблемы моделирования? Кто-нибудь может дать мне подсказку о том, что использовать? Из-за периодической природы проблемы я склонен искать временные ряды, однако это кажется излишним, потому что этот предмет еще не изучался в моем классе.

Для функций я бы хотел проверить размер приливов, длину побережья и фазу луны. Я также думаю, что поскольку детализация данных составляет не более часа, мы должны учиться ежедневно, а не ежемесячно (объем данных не слишком велик), и мы могли бы собрать более точную информацию.

Рассмотрим проблему прогнозирования приливов в данном месте с учетом ежедневных и месячные циклы. Предположим также, что у вас есть доступ к почасовым данным за период 10 года. Определите и обсудите, как бы вы смоделировали эту проблему: какие функции будут считается? Как система может учиться? Должны ли мы учиться ежедневно и ежемесячно циклы отдельно?

Ответы [ 2 ]

0 голосов
/ 14 марта 2019

Хотите ли вы предсказать прилив (максимум / минимум) по времени дня в определенном месте?

Сначала я бы использовал такие функции, как фаза луны (вы можете определить вектор объектов с помощью одного горячего кодирования длякаждая фаза), функция времени дня (снова одна горячая кодировка для каждого часа (или любой другой дискретизации, которую вы хотите));и, возможно, длина побережья;Объедините все эти функции (фаза, время суток, длина береговой линии), чтобы создать вектор объектов

Теперь, если вы хотите прогнозировать прилив / отлив, используя ваш набор данных: так как это периодически, я бы использовал комплекснелинейная модель, такая как случайный лес или дерево решений с градиентным усилением, способные выучить эту периодичность.

0 голосов
/ 14 марта 2019

Что вы хотите «выучить»? Я думаю, что вы можете использовать некоторую функцию расстояния и попробовать некоторую статистическую классификацию, такую ​​как K-Means, а затем предсказать, используя KNN на ваших кластерах

...