разработать нейронную сеть для прогнозирования продаж - PullRequest
1 голос
/ 06 апреля 2011

Я разрабатываю распределенную систему, в которой планируется использовать нейронную сеть для прогнозирования продаж.

Небольшое описание системы: система объединяет рабочие процессы таких модулей, как «Аптека», «Пациент» (электрическая карта здоровья) и модуль «Доктор».

проблема в том, что у меня много информации, связанной с продажами лекарств, и я немного запутался в проектировании нейронной сети.

Мой текущий дизайн: Входы (согласно данным, которые можно взять из базы данных):

  1. Дата: дата продажи лекарства покупателю (в формате ГГГГ / ММ / ДД).
  2. Возрастная категория пациента: значение, соответствующее возрастной категории пациента, например: (1 -> 12: ребенок, 13 -> 30: молодой… ..)
  3. Пол пациента.
  4. Идентификатор лекарства: значение, соответствующее лекарству.
  5. Идентификатор заболевания: значение, соответствующее заболеванию, обнаруженному врачом, который выписал рецепт.
  6. Стоимость единицы лекарства: значение, соответствующее стоимости покупки лекарства.
  7. Проданная единица лекарства: значение, соответствующее стоимости продажи лекарства.
  8. Идентификатор адреса аптеки: значение, соответствующее адресу аптеки.
  9. Идентификатор сезона: значение, соответствующее сезону продажи лекарства (летом, зимой и т. Д.).

Выходы:

  1. Количество: значение, соответствующее количеству лекарства, которое будет продано.
  2. Прибыль: значение, соответствующее сумме прибыли от продажи предыдущего количества.

вопрос в том, что я не уверен, имеет ли смысл этот дизайн, есть ли лучшее предложение?

и какой тип сетей я должен использовать для реализации этого проекта ... Я планирую использовать многоуровневую рекуррентную сеть ... Это хороший выбор или есть лучшая модель?

примечание: я планирую реализовать сеть, используя c # с "AForge.NET Framework".

надеюсь, что это описание ясное и простое, и извините за мой плохой язык.

Ответы [ 3 ]

3 голосов
/ 06 апреля 2011

Идентификаторы и категории делают плохой выбор фактических входных данных, потому что они не являются непрерывными и мало значат в их относительных величинах. Для идентификаторов может пригодиться создание отдельных сетей для разных категорий, но, учитывая большое количество идентификаторов и категорий, которые вы здесь определили, это означает, что у вас очень большое количество отдельных сетей, требующих большой пул обучающих данных. , поскольку он будет сильно разбавлен. Двоичные категории (например, пол) могут работать, но все, что имеет более одной категории, вероятно, не даст хороших результатов.

Будьте очень осторожны с нейронными сетями, поскольку, учитывая достаточно большую сеть, вы можете создать что-то, что, по-видимому, дает предсказания, но это действительно бессмысленно за пределами учебного набора. Убедитесь, что у вас есть большой набор для проверки, который не участвует в обучении.

1 голос
/ 06 апреля 2011

Похоже, что в нем отсутствуют некоторые биты информации.

Чтобы предсказать будущее, вам нужно исходное значение, чтобы перейти.Например, по заданному рецепту, насколько вероятно, что кто-то собирается его пополнить?Связана ли эта вероятность с какими-либо другими вашими показателями (возрастная группа, пол, дата продажи)?

Кроме того, сезон имеет отношение только с учетом местоположения пациента (ей) и, вероятно, только для определенных типов лекарств (Я думаю простуда / аллергия / грипп).Кроме того, для обеспечения какой-либо реальной сезонной точности вы должны будете ввести данные за этот сезон, такие как уровни аллергенов и т. Д.

Далее, стоимость лекарства и ожидания прибыли действительно связаны только с фактическимлекарства и не нужно прогнозировать вероятность продажи.

1 голос
/ 06 апреля 2011

Я спрашиваю, добавляет ли дата (в абсолютном выражении) какое-либо значение к модели.Если бы у вас было много лет данных, это могло бы дать некоторое значение, но показатель, например, в каком квартале находится дата, будь то выходные или будний день, или это в течение n дней после крупного выходного дня (и т. Д.), Можетбыть намного более могущественным.

Я не знаю, в какой области вы находитесь, поэтому у меня нет мнения о топологии сети.Если вы посмотрите какие-то статьи, возможно, есть обзорные статьи, посвященные вашей области исследования, в которых обсуждаются тенденции.

...