Я читаю о структуре данных Count-Min Sketch, которая дает вероятностный ответ на запросы точек и диапазонов на основе параметра вероятности ошибки и параметра допуска.
Например, КМ может ответить на вопрос «сколько раз с вероятностью 10% появляется элемент x в потоке данных».
Также возникла связанная с этим проблема тяжелых нападающих. Реализуя минимальную кучу для проблемы HH, я заметил, что в различных исследовательских работах указывается, что только если минимальное количество элементов в эскизе превышает пороговое значение, мы вставляем в кучу.
Мой вопрос: означает ли это, что мы вероятностно отвечаем на проблему тяжелых нападающих? Будет ли соответствующий вопрос «с вероятностью 10%, какой пункт был вторым по частоте в потоке данных?»