Будет ли здесь работать модель машинного обучения логистической регрессии? - PullRequest
0 голосов
/ 20 декабря 2018

Я учусь в 10 классе и собираюсь использовать модель машинного обучения для данных пациента, чтобы найти корреляцию между временем недели и приверженностью пациента.Я разделил неделю на 21 временной интервал, три для каждого времени дня (1 - утро понедельника, 2 - понедельник и т. Д.).Значения приверженности будут двоичными (0 означает, что они не принимали лекарство, 1 означает, что они принимали).Я буду моделировать данные обучения, проверки и тестирования для моей модели.Насколько я понимаю, я могу использовать модель логистической регрессии для вывода вероятности того, что пациент пропустит прием лекарства в определенный интервал времени, учитывая прошлые данные для этого интервала времени.Это потому, что логистическая регрессия выводит двоичные значения при заданном пороговом значении и подходит для задач, связанных с вероятностью и двоичными классами, что является моим сценарием.В моем случае, два класса, с которыми я имею дело, - да, они примут свое лекарство, и нет, они не будут.Но главная проблема в том, что эти данные будут нелинейными, по крайней мере, на мой взгляд.Чтобы сделать это более ясным, позвольте мне привести пример из реальной жизни.Если пациент посещает занятия йогой по воскресным утрам (временной интервал 19) и имеет тенденцию забывать принимать лекарства в это время, то большинство чисел во временном интервале 19 будет равно 0, в то время как все другие временные интервалы будут иметь гораздо больше1s.Цель состоит в том, чтобы создать модель машинного обучения, которая на основе прошлых данных может понять, что пациент, скорее всего, пропустит прием лекарств в следующем временном интервале 19. Я считаю, что логистическая регрессия должна использоваться для данных, которые по-прежнему имеют линейные данныераспределение, однако я не уверен.Я также понимаю, что нейронные сети идеальны для нелинейных распределений, но нейронные сети требуют большого количества данных для правильного функционирования, и в идеале цель моей модели - быть способной функционировать прилично с данными за несколько недель.Конечно, любая модель становится более точной с большим количеством данных, но мне кажется, что обычно нейронным сетям нужны тысячи наборов данных, чтобы действительно стать прилично точными.Опять же, я вполне могу ошибаться.

Мой вопрос на самом деле, какой тип модели будет работать здесь.Я знаю, что мне понадобится некоторая форма контролируемой классификации.Но могу ли я использовать логистическую регрессию, чтобы делать прогнозы, когда в определенное время недели сообщается о приверженности?

Действительно, любые отзывы о моем проекте очень ценятся!Пожалуйста, имейте в виду, что мне всего 15 лет, и поэтому некоторые из сделанных мною заявлений были, возможно, неправильными, и я не смогу полностью понять очень сложные ответы.

Мне также придется завершить это в течение следующих двух недель, поэтомуПожалуйста, не стесняйтесь ответить как можно скорее!Большое вам спасибо!

Ответы [ 2 ]

0 голосов
/ 23 декабря 2018

Это правда, что вам нужно много данных для применения нейронных сетей.Было бы полезно, если бы вы могли быть более точными в своем наборе данных и функциях.Вы также можете попробовать внедрить K-Means-Clustering для вашего проекта.Если ваша цель - выяснить, принимал ли пациент лекарство или нет, это можно сделать с помощью логистической регрессии.

0 голосов
/ 23 декабря 2018

По моему мнению, логистической регрессии будет недостаточно для этого, так как вы собираетесь использовать один параметр в качестве входных данных.Когда я представляю линию решения этой проблемы, я не думаю, что она может быть достигнута одним нейроном (логистическая регрессия).Для этого может потребоваться еще несколько нейронов или даже несколько слоев.И вам может понадобиться много данных для этой цели.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...