Я использую Dask и немного запутался.
Я запускаю нижеприведенное и просто получаю это до тех пор, пока не произойдет сбой процесса.
Он использует 100% всех 4 ядер ЦП при сбое ;
Кто-нибудь может мне посоветовать?
distributed.nanny - WARNING - Restarting worker
Вот код
import pandas as pd
import dask.dataframe as dd
import numpy as np
import time
from dask.distributed import Client
client = Client()
%time dahsn = dd.read_csv("US_Accidents_Dec19.csv")
dahsn.groupby('City').count().compute()