Как эффективно сохранить элементы (item1, item2, item3, ...) во фрейме данных в формате MBA (анализ корзины рынка): я имею в виду тип данных столбца items
, это список, строка или еще?
tran_id items
1 1, 1, 3
2 4, 6
3 3, 7
Я работаю над набором данных (около 1050000 записей) python3, pandas 0.24.2. И я хочу применить много операций над элементами транзакции, такими как подсчет, суммирование, сопоставление сходства.
Я использовал тип списка, как в коде:
trans = transactions.groupby(["tran_id"]).apply(lambda x: list(x['item_id'])).to_frame().rename(columns = {0:"items"})
, но когда я хочу иметь дело с предметы (например: print(df["items"].values
Я получил: [list([1,1,3]) list([4,6]) list([3, 7])]
также в добавить оператор дело, я получил TypeError: unhashable type: 'list'
)