Какую модель подбора данных использовать для этой проблемы - PullRequest
3 голосов
/ 11 мая 2019

Мой набор данных имеет 15 независимых переменных и 2 предиктора или ответ. Проблема состоит в том, чтобы найти отображение между входными и выходными переменными. В основном, с учетом вектора признаков в качестве входных данных, обученная модель даст оценочное или прогнозируемое значение ответа. Мои входные данные состоят из химической концентрации, урожайности, процентного содержания осадков и т. Д., И с помощью этих входных данных модель должна быть в состоянии предсказать значение почвы и температуру. Данные собираются за год.

Во время обучения модель должна быть в состоянии точно повторить ответ. Затем обученная модель должна иметь возможность выводить отклик дня с заданной функцией ввода для этого дня.

Я разделил данные - 70% я использовал для обучения и 30% для тестирования. Моя идея состояла в том, чтобы использовать документ LSTM Matlab . Можно ли использовать LSTM или есть лучшая модель для этой задачи?

Моя путаница заключается в том, что во всех документах LSTM применяется для прогнозирования на будущее. Но моя проблема заключается в приспособлении данных к функции. Я пытался использовать регрессию, но точность очень низкая. Пожалуйста, предложите, какие другие методы подходят для этой проблемы.

1 Ответ

0 голосов
/ 12 мая 2019

LSTM кажется излишним для вашей проблемы. Если вы считаете, что ток ph и температура могут быть полностью объяснены током концентрацией, выходом и т. Д., То вам действительно нужно просто приспособить простую регрессию (не обязательно линейную), вместо моделей временных рядов, таких как LSTM.

Прежде чем перейти к нейронным сетям, я бы рекомендовал попробовать: - линейная регрессия с нелинейными (например, полиномиальными или сплайновыми) признаками - ансамбли деревьев: случайный лес и усиление градиента

Нейронные сети превосходны в извлечении функций, но если у вас уже есть правильно сформированные функции, более простые типы моделей могут быть лучшим выбором.

...