У меня огромный набор данных для обучения word2ve c.
Пример выглядит следующим образом.
15 24 0
22 23 1
11 15 0
22 27 1
...
Я хочу случайным образом отобрать его.
Я пытался использовать функцию кодеков и функцию разделения.
Но этот файл слишком большой, поэтому код делает ошибку памяти.
Чтобы избежать ошибки памяти, я использую for и open (). например,
for line in open(fileNM):
train(line)
Но таким образом я могу получить доступ к данным только последовательным способом.
Как получить произвольный доступ к данным без полного чтения?