В настоящее время я пытаюсь придумать полуприличный (с учетом сложности, статистических свойств и здравого смысла) алгоритм для выборки.
Данные в настоящее время содержатся в хеш-таблице, где каждый ключ являетсяitem, а значение ключа - это частота элемента в исходном распределении.
Если кто-то хотел бы выбрать из такой гистограммы, как бы он это сделал, если бы он хотел сохранить исходные вероятности элементов и передать ихв образец?
Кроме того, мы требуем, чтобы был флаг того, разрешены ли дубликаты в образце.В случае недопущения дубликатов, лучшее, что я придумал, - это применить алгоритм из абзаца выше и удалить элемент из хеш-таблицы после его выборки.Таким образом, по крайней мере, относительные вероятности сохраняются среди оставшихся элементов.Однако я не уверен, является ли это общепринятой практикой по статистике.
Существует ли общепринятый алгоритм для этого?Если это поможет, нам нужно реализовать его в Common Lisp.