Можно ли использовать дерево решений h2o на кадре данных, где один столбец является списком? - PullRequest
0 голосов
/ 09 июля 2019

В настоящее время у меня есть df с числовыми и категориальными значениями.Проблема в том, что в одном из столбцов есть список категориальных значений: Colors: [[red,blue,green],[red,black]...]

Я пытался преобразовать df в h2o df с:
#convert df to h2o frame
data = h2o.H2OFrame(pantheon_data)

Но получил следующую ошибку:
ValueError: `python_obj` is not a list of flat lists!

Есть ли способ сохранить столбец "Цвета" и просто сгладить список так, чтобы значения были разделены запятой?и если это возможно, будет ли работать алгоритм?Если это невозможно, что еще я могу сделать?

1 Ответ

0 голосов
/ 11 июля 2019
def listToString(lis):
    return ",".join(lis)

df["Colors"] = df['Colors'].apply(listToString)

Это преобразует [red,blue,green] в red,blue,green, т.е. в строку.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...