У меня ошибка при чтении файла с dask, который работает с пандами:
import dask.dataframe as dd
import pandas as pd
pdf = pd.read_csv("./tous_les_docs.csv")
pdf.shape
(20140796, 7)
, в то время как dask выдает мне ошибку:
df = dd.read_csv("./tous_les_docs.csv")
df.describe().compute()
ParserError: Error tokenizing data. C error: EOF inside string starting at line 192999
Ответ: Добавление "blocksize = None "заставить это работать:
df = dd.read_csv("./tous_les_docs.csv", blocksize=None)