koalas Назначение столбца не поддерживает тип ndarray - PullRequest
1 голос
/ 09 июля 2020

All - Я пытаюсь добавить новый столбец в существующий фрейм данных koalas, но это не удается с указанной выше ошибкой. Значение, которое я присваиваю, - это массив np. Я что-то вообще упускаю? Это хорошо работает с pandas.

import databricks.koalas as ks
from sklearn.datasets import load_iris
iris = load_iris()
df = ks.DataFrame(data=iris.data, columns=iris.feature_names)
# works so far!!

df["target"] = iris.target ## this errors out!

TypeError: назначение столбца не поддерживает тип ndarray

Мне здесь что-то не хватает?

спасибо.

Ответы [ 2 ]

1 голос
/ 09 июля 2020

К сожалению, даже df.assign не решил проблему, и я получал ту же ошибку:

Мне пришлось сделать это:

ks.reset_option('compute.ops_on_diff_frames')
# convert target to a koalas series so that it can be assigned to the dataframe as a column
ks_series = ks.Series(iris.target)
df["target"] = ks_series
ks.reset_option('compute.ops_on_diff_frames')
0 голосов
/ 09 июля 2020

Моя ошибка:

Я неправильно понял, где и в чем была проблема. Попробуйте следующее:

...
df.assign(target=iris.target)

Не могли бы вы попробовать следующее:

...
df = ks.DataFrame(data=iris.data, columns=list(iris.feature_names))
...

Заглянув в документацию load_iris , они не пытаются преобразовать возвращенный массив в список.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...