Параметры промышленного производства для моделей машинного обучения - PullRequest
0 голосов
/ 22 февраля 2019

Я начал свою магистерскую диссертацию для пищевой компании.Они начинают с нескольких ингредиентов, смешивают их, нагревают и так далее, пока, наконец, не получат конфеты.Но есть проблема.Для производства одной и той же конфеты машины, управляемые ПЛК, не всегда работают гладко и не дают одинакового результата.Они считают, что это фрукт как ингредиент, который не всегда на 100% одинаков (вязкость и т. Д.).Они измеряют характеристики ингредиентов, прежде чем они будут использованы для производства.Они также измеряют все параметры процесса (давление, температура, шкала Брикса и т. Д.).Все это хранится.Теперь моя задача - изучить эти данные с помощью моделей машинного обучения, чтобы получить больше информации.Теперь я сталкиваюсь с некоторыми проблемами.Первая проблема заключается в том, что у меня нет классификации.Нет такой вещи как «хорошая конфета» и «плохая конфета».Вторая проблема в том, что у меня действительно нет выходных параметров.У меня есть значение Brix, но это все.Последний вопрос: ингредиенты - это входные характеристики для моей модели, но особенности процесса - это тоже входные данные?Или я должен просто оставить это позади?

Большое спасибо за помощь!

1 Ответ

0 голосов
/ 22 февраля 2019

Первая проблема заключается в том, что у меня нет классификации.Не существует таких понятий, как «хорошая конфета» и «плохая конфета».

Как компания решает, что достаточно или нет?Вам нужно определить критерии, которые они используют для маркировки конфет как «плохих» или «хороших».Если у вас нет меток, вам, возможно, придется искать неконтролируемые методы обучения, такие как кластерный анализ или факторный анализ.

Вторая проблема заключается в том, что у меня нет выходных параметров.У меня есть значение Brix, но это все.

В зависимости от вашей задачи вам придется подумать о том, каковы ваши целевые значения.Для классификации это будет этикетка конфеты.Следовательно, «плохая» или «хорошая» конфета.Для проблем регрессии вам понадобится что-то непрерывное (например, значение Брикса, если это соответствует вашей цели).Для обучения без учителя вам не нужна выходная переменная.

Последний вопрос: ингредиенты - это входные характеристики для моей модели, но особенности процесса, эти входные данные тоже?Или я должен просто оставить это позади?

Вы должны посмотреть на все переменные, которые у вас есть, и решить, какие из них содержат ценную информацию, если конфета «хорошая» или «плохая».Это конкретные знания предметной области, которые вам нужно собрать.Вы можете спросить людей в компании.Они должны быть в состоянии сказать вам, что важно или нет.Вы также можете посмотреть статистику по всем параметрам.Параметры, которые связаны с качеством конфеты должны быть определены.Параметрами, которые не сильно различаются (например, температура всегда постоянна), можно пренебречь.

...