Question

Я разрабатываю скрипт, который обнаруживает пики в данных сигнала из биологического источника. Я хочу создать полуавтоматическую модель, которая помогает предсказать, какие вершины являются правильными. Этот сценарий улучшается, поскольку пользователь вручную выбирает несколько из этих пиков, чтобы помочь модели определить, какие из них являются правильными.

Рабочий процесс, который я пытаюсь реализовать, заключается в следующем: 1. Пользователь вручную выбирает данные 2. Сценарий получает правильные данные и вписывает их в модель 3. Используйте модель для прогнозирования вероятности того, что данный пик будетбудь прав. 4. Надеюсь, с достаточным количеством данных и обучением, он может быть автоматизирован для прохождения остальных.

Я также не знаю название общей темы, и я изо всех сил пытаюсь найти, что гуглить.

Я пытался вписать его в модель линейной регрессии в scikit learn, но у меня недостаточно наборов данных (как он узнает из первого вмешательства пользователя). Возможно ли то, что я делаю?

Craig · Answer 1 · 08 октября 2019

Извините за общий характер этого ответа, но ОП попросил общие темы.

Звучит как полууправляемое обучение и здесь для scikit-learn и здесь для более подробной информации может работать.

Нет помеченных данных для запуска. Ручной процесс запускается для получения некоторых помеченных данных. Вскоре, полу-контролируемые могут начать и взять на себя - с процессом, измеряющим его точность. Соответствие вашей ситуации и хорошее место для начала.

В конце концов у вас может появиться «достаточно» правильно помеченных данных, которые вы сможете исследовать, подбирая классический алгоритм для прогнозирования остатка. «Достаточно» относиться к тому, насколько сложна проблема. Может быть десятки, сотни, тысячи, ...

В зависимости от других деталей вашей ситуации, Обучение усилению может работать. Как вы описали ситуацию, это может не сработать, но в вашей среде могут быть и другие детали, позволяющие использовать это семейство.

Слово предупреждения - машинное обучение и, в частности, полууправляемый, не всегда хорошо работают для каждой проблемы. ,Мера, мера, мера.

W. White · Answer 2 · 09 октября 2019

Спасибо всем за вашу помощь. Я разговаривал с коллегой, и он направил меня на Машинное обучение онлайн . Я думаю, что это был тот, кого я искал. Хотя я не буду ни обрабатывать данные временных рядов, ни передавать данные из Интернета, я думаю, что этот метод достаточен для моих нужд. Этот метод позволяет обрабатывать данные один за другим, а не как пакет. Я думаю, что в настоящее время SciKit Learn не имеет возможности готового онлайнового машинного обучения.

Это , я думаю, дает краткое изложение сильных сторон онлайнового машинного обучения (такжедемонстрация библиотеки питона creme).

Еще раз спасибо!

Модель линейной регрессии, которая улучшается по мере того, как пользователь выбирает и обучает данные

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Модель линейной регрессии, которая улучшается по мере того, как пользователь выбирает и обучает данные

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов