Как мне предварительно обработать набор данных KDD для извлечения правил ассоциации (алгоритм Apriori) в python? - PullRequest
0 голосов
/ 05 мая 2020

Набор данных: NSL KDD Формат: .csv Набор данных: NSL KDD Формат: .csv Обычно для анализа рыночной корзины используется алгоритм Apriori, который дает нам взаимосвязь между продуктами. Количество купленных товаров значения не имеет. Например, алгоритм сообщает вам, покупается ли молоко, затем покупается масло и с какой «уверенностью» (т. Е. Какой еще продукт покупатель, вероятно, купит вместе с молоком). Здесь не важно количество купленного молока или масла. Мы пытаемся применить это к набору данных NSL KDD. В этом наборе данных 41 атрибут (характеристики - столбцы), которые помогают классифицировать атаки. Некоторые атрибуты имеют формат numeri c, некоторые - строки. Как мы предварительно обрабатываем набор данных KDD, чтобы сгенерировать список часто используемых элементов и правила ассоциации с использованием python?

...