У меня есть следующий код:
feature_array = da.concatenate(features, axis=1)#.compute()
model = KMeans(n_clusters=4)
model.fit(features, y=None)
Теперь, если я сначала вычисляю feature_array, этот код работает просто отлично, но без него он дает некоторую внутреннюю ошибку TypeError, которую я не могу понять:
File "/Users/(...)/lib/python3.7/site-packages/dask_ml/utils.py", line 168, in check_array
sample = np.ones(shape=shape, dtype=array.dtype)
File "/Users/(...)/lib/python3.7/site-packages/numpy/core/numeric.py", line 207, in ones
a = empty(shape, dtype, order)
TypeError: 'float' object cannot be interpreted as an integer
Разве я не должен использовать массив dask с dask_ml? Основная причина, по которой я хочу использовать dask_ml, заключается в том, что я хочу, чтобы этот код мог работать с наборами данных, превышающими объем памяти.
Приветствия, Флориан