Ошибка означает: «Пожалуйста, включите необязательный аргумент ключевого слова sample
в свой вызов read_csv
, дающий значение (в байтах), которое достаточно велико для включения одной строки данных». Посмотрев на функцию docstring , вы увидите, что значение по умолчанию - 256000 байт.
Так что, возможно, попробуйте
df = dd.read_csv('file1.csv', sample=1000000)