Первая проблема заключается в том, что у меня нет классификации.Не существует таких понятий, как «хорошая конфета» и «плохая конфета».
Как компания решает, что достаточно или нет?Вам нужно определить критерии, которые они используют для маркировки конфет как «плохих» или «хороших».Если у вас нет меток, вам, возможно, придется искать неконтролируемые методы обучения, такие как кластерный анализ или факторный анализ.
Вторая проблема заключается в том, что у меня нет выходных параметров.У меня есть значение Brix, но это все.
В зависимости от вашей задачи вам придется подумать о том, каковы ваши целевые значения.Для классификации это будет этикетка конфеты.Следовательно, «плохая» или «хорошая» конфета.Для проблем регрессии вам понадобится что-то непрерывное (например, значение Брикса, если это соответствует вашей цели).Для обучения без учителя вам не нужна выходная переменная.
Последний вопрос: ингредиенты - это входные характеристики для моей модели, но особенности процесса, эти входные данные тоже?Или я должен просто оставить это позади?
Вы должны посмотреть на все переменные, которые у вас есть, и решить, какие из них содержат ценную информацию, если конфета «хорошая» или «плохая».Это конкретные знания предметной области, которые вам нужно собрать.Вы можете спросить людей в компании.Они должны быть в состоянии сказать вам, что важно или нет.Вы также можете посмотреть статистику по всем параметрам.Параметры, которые связаны с качеством конфеты должны быть определены.Параметрами, которые не сильно различаются (например, температура всегда постоянна), можно пренебречь.