Я не знаю, является ли stackoverflow подходящим местом для публикации, если нет, скажите, пожалуйста, альтернативу.
У меня есть набор данных, в котором я хочу классифицировать данные в столбце "opmerking" (opmerking = comment).Я создал фиктивный набор данных, чтобы объяснить, что я имею в виду.
каждое число представляет байт, где каждый бит означает что-то еще.Итак, у меня есть скрипт, который берет самые важные биты из этих байтов, и этот набор данных выглядит следующим образом:

Байты / биты должны указывать циклычасти оборудования, и мне нужно определить, где цикл не является нормальным.До сих пор я могу обнаружить строки, в которых происходит ненормальное поведение, но мне хотелось бы, чтобы полный цикл.
это код, который я использую для поиска отклонений в битовых данных:
dfphotocells = dfsamen[(dfsamen.closeout == 0) & (dfsamen.openout == 0) & (dfsamen.limitswitchopen == 0) & (dfsamen.limitswitchclose == 0) & (dfsamen.prelimit == 0) & (dfsamen.photocells == 1) & (dfsamen.lampgroen == 1) & (dfsamen.lamprood == 1) & (dfsamen.halfopen == 0 ) & (dfsamen["DateTime"]>='2018-06-1 00:00:00') & (dfsamen["DateTime"]<='2018-10-10 00:00:00')]
dfphotocells['opmerking'] = 'photocells'
это, очевидно,дает только строки, где фотоэлементы = 1.
Я думал об использовании наивного байесовского классификатора, но я не знаю, насколько точным это будет.
Итак, мой полный вопрос: должен ли я смотреть на свои циклы побитово или побитно и какой метод я должен использовать для обнаружения полного цикла?(я не ищу кого-то, кто мог бы написать это для меня, просто толчок в правильном направлении)