Звучит так, как будто вы описываете гистограмму: вы создаете «бункеры» того размера, который вы описываете, с необработанными значениями.Сумма отсчетов для бинов - это общее количество сеансов.Чтобы получить процент от общего трафика, вы просто нормализуетесь путем деления каждого бина на общее количество потоков.
Итак, если вы делаете гистограмму с двумя бинами, где первый бин - это счетчик всех сеансов с <100 пакетными потоками и другими 100+ пакетными потоками (обратите внимание, что не может быть пробелов или перекрытий)и он работает с 30 потоками в первом и 60 во втором, тогда общее количество потоков составляет 90, и у вас есть 33% потоков, составляющих менее 100 пакетов. </p>
При работе с несколькимиУловка заключается в том, чтобы всегда использовать одни и те же границы бина, хранить и работать с необработанными счетчиками как можно дольше и получать только% s как самый последний шаг.Вы можете без труда сложить гистограммы, если их ячейки означают одно и то же, а затем, когда вы нормализуете результат, у вас есть для каждой ячейки общий процент для всех файлов.Если вам понадобится добавить файл, просто следите за необработанными значениями, чтобы можно было повторно нормализовать их при появлении новых данных.
Вы можете сделать это в таком инструменте, как Matlab, довольно легко, нобудьте осторожны, потому что многие из этих инструментов будут любезно автоматически определять ширину корзины.Таким образом, гистограмма для одного файла может иметь ячейки {x <100, 100 <= x <200, x> = 200} и другой файл, {x <90, 90 <= x <180, x> = 180}, и выне сможет сложить результаты вместе.