Как эффективно сохранить элементы данных pandas в формате MBA? - PullRequest
0 голосов
/ 06 января 2020

Как эффективно сохранить элементы (item1, item2, item3, ...) во фрейме данных в формате MBA (анализ корзины рынка): я имею в виду тип данных столбца items, это список, строка или еще?

tran_id          items
   1            1, 1, 3
   2             4, 6
   3             3, 7

Я работаю над набором данных (около 1050000 записей) python3, pandas 0.24.2. И я хочу применить много операций над элементами транзакции, такими как подсчет, суммирование, сопоставление сходства.

Я использовал тип списка, как в коде:

trans = transactions.groupby(["tran_id"]).apply(lambda x: list(x['item_id'])).to_frame().rename(columns = {0:"items"})

, но когда я хочу иметь дело с предметы (например: print(df["items"].values Я получил: [list([1,1,3]) list([4,6]) list([3, 7])] также в добавить оператор дело, я получил TypeError: unhashable type: 'list')

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...