Я пытаюсь создать действительно простой инструмент в Python.
У меня есть список, очень большой список (около 5 ГБ) в формате .csv номеров лотереи.
По какой-то причине я не могу получить Pandas или даже обычные SQL Базы данных, чтобы преобразовать этот список в таблицу, а затем случайным образом выбрать число (пытаясь выбрать случайного победителя)
Поэтому было предложено, чтобы я разбить .csv на куски с помощью кода (пока у меня нет возможности даже открыть список).
Главный вопрос в том, насколько случайный будет происходить, если я это сделаю? Допустим, он разбивает его на 5 частей, а затем я прошу его выбрать случайную строку данных из ЛЮБОГО из этих пяти фрагментов. Действительно ли случайный результат показывает 100% случайную строку данных, или это вызвано необходимостью случайного запуска на обоих уровнях. IE - случайным образом выберите один из этих пяти фрагментов, а затем случайным образом выберите число из них.
Если я сделаю это таким образом, разве это не повлияет на то, насколько он действительно случайный? Или я просто схожу с ума, думая о статистике вокруг этого?
(Дополнительный вопрос, я до сих пор даже не придумал четкого способа разбить CSV на управляемые куски, так что есть какие-нибудь советы было бы круто!)