Чтение данных столбца с помощью dask - PullRequest
0 голосов
/ 29 апреля 2020

У меня есть данные столбца, которые в настоящее время читаются с использованием numpy.loadtxt(filename,usecols=[0,1,2,3],dtype=float). Это прекрасно работает, когда размер файла не так велик. На данный момент размер файла данных составляет около 50 ГБ, а numpy.loadtxt() занимает слишком много времени.
Существует ли более эффективный способ чтения этих данных с использованием dask и последующего преобразования его в массив numpy?

PS: я раньше не употреблял даска.

...