Правильная настройка нейронной сети для анализа местоположения в местоположение - PullRequest
2 голосов
/ 28 октября 2010

Я пытаюсь обучить нейронную сеть для системы, которую можно рассматривать как почтовую сеть на макроуровне.Мои входные данные представляют собой два местоположения (одно из 50 штатов США) вместе с 1–3 другими переменными, и я хочу получить числовой результат.

Моим первым желанием было представить состояния в виде числового значения от 0 до49, а затем иметь сеть только с 3 или около того входами.Однако я обнаружил, что мои тренировки никогда не сходятся на полезной ценности.Я предполагаю, что это потому, что значения для состояний совершенно произвольны - значение 39 для MA не имеет отношения к значению 38 для CA, особенно когда 37 представляет собой возврат к CT.

Isесть ли лучший способ для меня это сделать?Должен ли я создавать сеть с более чем 100 входами, представляющими логические значения для состояний отправления и назначения?

1 Ответ

1 голос
/ 28 октября 2010

Я думаю, что ваша интуиция о сложности представления различных состояний в виде последовательных целых чисел верна - это представление сжимает много информации в каждом входе. Это означает, что вашей сети, возможно, придется многому научиться о том, как декодировать эту информацию в факты, которые действительно полезны для решения вашей проблемы.

Может помочь одно состояние на вход с логическими входами. Для сети было бы проще определить, о каких двух состояниях вы говорите. Конечно, такой подход не обязательно позволяет сети узнавать полезные факты о том, какие состояния соседствуют друг с другом.

Может быть полезно попытаться определить, существуют ли какие-либо виды информации, которые вам легко предоставить и которые также могут упростить обучение . Например, если физическое расположение штатов важно для решения вашей проблемы (т. Е. КТ примыкает к Нью-Йорку, который примыкает к ПА), то, возможно, вы можете разбить страну на регионы (например, северо-запад, юго-восток, средний запад) и предоставить логическое значение входы для каждого региона.

Подача нескольких подобных схем ввода в одну сеть может позволить вам указать одно состояние, используя (потенциально) более полезное представление: вместо того, чтобы сказать «это состояние # 39», вы можете сказать (например) «это самое северное государство , которое касается более чем пяти соседних государств в восточном регионе".

Если сеть считает полезным определить, находятся ли два состояния рядом друг с другом, такое представление может ускорить процесс обучения - сеть может получить приблизительное представление, если два состояния близки, просто сравнив два «региона». «входы для штатов. Проверить, равны ли два входа области, гораздо проще, чем запомнить тот факт, что состояние # 39 находится рядом с состояниями # 38, # 21, # 7 и # 42.

...