Профиль пакета из netflow - PullRequest
       40

Профиль пакета из netflow

0 голосов
/ 16 января 2012

У меня есть данные netflow за предыдущий месяц в файлах за 5 минут, и я хотел бы сделать профиль пакета всего этого трафика.Мне нужно процентное представление 1 потоков пакетов, 2 потоков пакетов и т. Д. Это можно сделать в категориях, таких как 1 поток пакетов, 1-100 потоков пакетов, 100 и более ... Это не так важно.Но мой вопрос, как это сделать.Как сделать процентное представление данных, которые я не могу сложить вместе?Что-то вроде сделать процентное представление для каждого файла, а затем сделать какой-то тип среднего из него?

Ответы [ 2 ]

0 голосов
/ 13 августа 2012

Звучит так, как будто вы описываете гистограмму: вы создаете «бункеры» того размера, который вы описываете, с необработанными значениями.Сумма отсчетов для бинов - это общее количество сеансов.Чтобы получить процент от общего трафика, вы просто нормализуетесь путем деления каждого бина на общее количество потоков.

Итак, если вы делаете гистограмму с двумя бинами, где первый бин - это счетчик всех сеансов с <100 пакетными потоками и другими 100+ пакетными потоками (обратите внимание, что не может быть пробелов или перекрытий)и он работает с 30 потоками в первом и 60 во втором, тогда общее количество потоков составляет 90, и у вас есть 33% потоков, составляющих менее 100 пакетов. </p>

При работе с несколькимиУловка заключается в том, чтобы всегда использовать одни и те же границы бина, хранить и работать с необработанными счетчиками как можно дольше и получать только% s как самый последний шаг.Вы можете без труда сложить гистограммы, если их ячейки означают одно и то же, а затем, когда вы нормализуете результат, у вас есть для каждой ячейки общий процент для всех файлов.Если вам понадобится добавить файл, просто следите за необработанными значениями, чтобы можно было повторно нормализовать их при появлении новых данных.

Вы можете сделать это в таком инструменте, как Matlab, довольно легко, нобудьте осторожны, потому что многие из этих инструментов будут любезно автоматически определять ширину корзины.Таким образом, гистограмма для одного файла может иметь ячейки {x <100, 100 <= x <200, x> = 200} и другой файл, {x <90, 90 <= x <180, x> = 180}, и выне сможет сложить результаты вместе.

0 голосов
/ 05 апреля 2012

Что вы имеете в виду под "Я не могу сложить вместе"? На самом деле вы можете сделать это с помощью nfdump , если вы посмотрите руководство: -R expr / dir / file1: file2 Считать все файлы из file1 в file2 . Для istance

nfdump -R /yournetflowfolder/nfcapd.201204051609:nfcapd.201204051639

будет собирать информацию NetFlow с 16:09 до 16:39. Затем вы можете выполнить любой запрос по этим данным.

...