Самый эффективный тип файла для произвольного доступа к данным - PullRequest
1 голос
/ 26 мая 2020

Пишу программу генерации паролей. Я собрал список из 30 000 английских sh слов и планирую выбирать из них случайным образом по индексу.

В настоящее время у меня есть все слова в файле .txt, каждое из которых разделено символом новой строки и организовано по длине.

Мой текущий план - написать программу на C ++, потому что это язык, на котором мне удобнее всего, поэтому я могу просто загрузить весь файл в память, но это кажется невероятно небрежным.

Что было бы более эффективным способом (или тип файла, например JSON, если необходимо) сделать это? Спасибо

1 Ответ

5 голосов
/ 26 мая 2020

30 000 слов звучат как незначительный объем данных для загрузки. Даже если это ~ 50-500 МБ, просто загрузите его и забудьте об этом.

В современной системе это займет доли секунды, sh в первый раз, любой SSD может сделать ~ 600 МБ / s + и даже меньше, если он находится в дисковом буфере ОС.

...