Модель линейной регрессии, которая улучшается по мере того, как пользователь выбирает и обучает данные - PullRequest
0 голосов
/ 08 октября 2019

Я разрабатываю скрипт, который обнаруживает пики в данных сигнала из биологического источника. Я хочу создать полуавтоматическую модель, которая помогает предсказать, какие вершины являются правильными. Этот сценарий улучшается, поскольку пользователь вручную выбирает несколько из этих пиков, чтобы помочь модели определить, какие из них являются правильными.

Рабочий процесс, который я пытаюсь реализовать, заключается в следующем: 1. Пользователь вручную выбирает данные 2. Сценарий получает правильные данные и вписывает их в модель 3. Используйте модель для прогнозирования вероятности того, что данный пик будетбудь прав. 4. Надеюсь, с достаточным количеством данных и обучением, он может быть автоматизирован для прохождения остальных.

Я также не знаю название общей темы, и я изо всех сил пытаюсь найти, что гуглить.

Я пытался вписать его в модель линейной регрессии в scikit learn, но у меня недостаточно наборов данных (как он узнает из первого вмешательства пользователя). Возможно ли то, что я делаю?

Ответы [ 2 ]

1 голос
/ 08 октября 2019

Извините за общий характер этого ответа, но ОП попросил общие темы.

Звучит как полууправляемое обучение и здесь для scikit-learn и здесь для более подробной информации может работать.

Нет помеченных данных для запуска. Ручной процесс запускается для получения некоторых помеченных данных. Вскоре, полу-контролируемые могут начать и взять на себя - с процессом, измеряющим его точность. Соответствие вашей ситуации и хорошее место для начала.

В конце концов у вас может появиться «достаточно» правильно помеченных данных, которые вы сможете исследовать, подбирая классический алгоритм для прогнозирования остатка. «Достаточно» относиться к тому, насколько сложна проблема. Может быть десятки, сотни, тысячи, ...

В зависимости от других деталей вашей ситуации, Обучение усилению может работать. Как вы описали ситуацию, это может не сработать, но в вашей среде могут быть и другие детали, позволяющие использовать это семейство.

Слово предупреждения - машинное обучение и, в частности, полууправляемый, не всегда хорошо работают для каждой проблемы. ,Мера, мера, мера.

0 голосов
/ 09 октября 2019

Спасибо всем за вашу помощь. Я разговаривал с коллегой, и он направил меня на Машинное обучение онлайн . Я думаю, что это был тот, кого я искал. Хотя я не буду ни обрабатывать данные временных рядов, ни передавать данные из Интернета, я думаю, что этот метод достаточен для моих нужд. Этот метод позволяет обрабатывать данные один за другим, а не как пакет. Я думаю, что в настоящее время SciKit Learn не имеет возможности готового онлайнового машинного обучения.

Это , я думаю, дает краткое изложение сильных сторон онлайнового машинного обучения (такжедемонстрация библиотеки питона creme).

Еще раз спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...