У меня есть столбец, который представляет собой список списков ix
, и другой столбец, который содержит списки users
.Я хотел бы использовать ix
в качестве индекса для users
.Ниже показан небольшой пример.
l = [('store1', [[0, 1], [2, 3]], [1001, 1002, 1003, 1004, 1005, 1006])]
df = sqlContext.createDataFrame(l,('store','ix','users'))
+------+--------------------+--------------------+
| store| ix| users|
+------+--------------------+--------------------+
|store1|[WrappedArray(0, ...|[1001, 1002, 1003...|
+------+--------------------+--------------------+
Я бы хотел, чтобы результат был
want = [('store1', [[0, 1], [2, 3]], [1001, 1002, 1003, 1004, 1005, 1006], [[1001,1002],[1003,1004]])]
want = sqlContext.createDataFrame(want,('store','ix','users','new_col'))
Это почти как если бы я сделал users[ix]
.
Что такоелучший способ сделать это?