Question

Я хочу выбрать количество случайных слов из массива, чтобы получить общее количество 36 букв.

Сначала я попытался выбрать случайное слово и добавить его после проверки того, что оно не длиннее, чем количество свободного места, которое у нас есть. Это было неэффективно, поскольку список заполнялся и оставалось только пустое место для 2-3 буквенных слов, и такое короткое слово занимает много времени.

Поэтому я решил выбрать только шесть 6-буквенных слов, и я делаю это, генерируя случайное число, а затем увеличивая его на 1, пока мы не найдем 6-буквенное слово. Это довольно быстро, но слова на самом деле не настолько случайны, часто я получаю слова, начинающиеся с одной и той же буквы, или только слова, начинающиеся с букв в последовательности, таких как a, b, c или x, y, z.

srand ( time(NULL) );
for(int i=0;i<6;i++)
{
    randNumb = rand()%dictionary.size();
    while(dictionary.at(randNumb).length() != 6)
    {
        randNumb++;
    }
    a << "/" << dictionary.at(randNumb) << "/";
}

Я бы хотел выбрать слова различной длины, но в пользу производительности я остановлюсь только на 6-буквенных словах, но тогда я бы по крайней мере хотел бы, чтобы они выбирались случайным образом.

PlasmaHH · Answer 1 · 04 марта 2012

Вы должны получить новое случайное число вместо увеличения индекса.Таким образом, все строки, не соответствующие вашим критериям, «привлекают» больше случайных чисел и, возможно, приводят к тому, что следующая строка имеет более высокую вероятность выбора.

Adrian McCarthy · Answer 2 · 04 марта 2012

Даже если RAND_MAX больше dictionary.size(), использование оператора % для выбора индекса приводит к неравномерному распределению.Модуль заставит ранние слова выбираться чаще, чем более поздние (если RAND_MAX + 1 не является целым кратным dictionary.size()).

Рассмотрим простой пример: предположим, что в вашем словаре 10 слов, иRAND_MAX равно 14. Когда rand() возвращает значение от 0 до 9, соответствующее слово выбирается напрямую.Но когда rand() это 10-14, тогда будет выбрано одно из первых пяти слов.Таким образом, первые пять слов имеют в два раза больше шансов быть выбранными, чем последние пять слов.

Лучший способ отобразить [0 .. RAND_MAX] в [0 .. dictionary.size()) - использовать деление:

assert(RAND_MAX + 1 >= dictionary.size());
randNumb = rand() * dictionary.size() / (RAND_MAX + 1);

Но вы должны быть осторожны с целочисленным переполнением.Если RAND_MAX * dictionary.size() больше, чем вы можете представить в целом числе, вам нужно будет использовать больший тип данных.Некоторые системы имеют такую функцию, как MulDiv именно для этой цели.Если у вас нет что-то вроде MulDiv, вы можете преобразовать его в тип с плавающей запятой и затем усечь результат обратно в целое число:

double temp = static_cast<double>(rand()) * dictionary.size() / (RAND_MAX + 1);
randNumb = static_cast<int>(temp);

Это все еще несовершенныйраспределением, но «горячие» слова теперь будут равномерно распределяться по словарю, а не сгущаться в начале.

Чем ближе RAND_MAX + 1 к целому кратному dictionary.size(), тем лучше для васбыть.И если вы не можете быть уверены, что он близок к целочисленному кратному, тогда вы хотите, чтобы RAND_MAX был как можно больше по отношению к dictionary.size().

, так как вы не имеете большого контроля над RAND_MAXВы могли бы рассмотреть возможность настройки dictionary.size().Например, если вам нужны только шестибуквенные слова, то почему бы не убрать все остальные из словаря?

std::vector<std::string> six_letter_words;
std::copy_if(dictionary.begin(), dictionary.end(),
             std::back_inserter(six_letter_words),
             [](const std::string &word){ return word.size() == 6; });

С уменьшенным набором мы можем использовать более общий алгоритм для выбора слов:

typedef std::vector<std::string> WordList;

// Returns true with the given probability, which should be 0.0 to 1.0.
bool Probably(double probability) {
    return (static_cast<double>(std::rand()) / RAND_MAX) < probability;
}

// Selects n words from the dictionary using a normal distribution and
// copies them to target.
template <typename OutputIt>
OutputIt Select(int n, const WordList &dictionary, OutputIt target) {
    double count = static_cast<double>(n);
    for (std::size_t i = 0; count > 0.0 && i < dictionary.size(); ++i) {
        if (Probably(count / (dictionary.size() - i))) {
            *target++ = dictionary[i];
            count -= 1.0;
        }
    }
    return target;
}

Идея состоит в том, чтобы пройтись по каждому слову в словаре и выбрать его с вероятностью числа слов, которое нужно выбрать, деленного на количество слов, из которых осталось выбрать.Это хорошо работает, даже если RAND_MAX относительно мало.В целом, однако, это гораздо больше вычислений, чем попытка случайного выбора индексов.Также обратите внимание, что этот метод никогда не выберет одно и то же слово более одного раза, в отличие от метода отображения индекса.

Вы вызываете Select следующим образом:

// Select six words from six_letter_words using a normal distribution.
WordList selected;
Select(6, six_letter_words, std::back_inserter(selected));

Также обратите внимание, что большинство реализацийrand() довольно просты и могут не дать хорошего нормального распределения для начала.

Alex Reynolds · Answer 3 · 04 марта 2012

Функция rand() генерирует число от 0 до RAND_MAX.

Если RAND_MAX определено как 32767, то вы не получите доступ к элементам в своем словаре (массиве?) С индексами, превышающими это значение.

Если вам нужно сгенерировать случайное числобольше RAND_MAX, затем подумайте о суммировании результата n вызовов rand(), таких, что n * RAND_MAX >= dictionary.size().Модуль этого результата гарантированно даст индекс, который находится где-то в границах всего словаря.

Случайный выбор словарных слов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Случайный выбор словарных слов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы