У меня очень большой dataset
из примерно 400 тыс. Строк.
Что-то в этом роде, это не полный набор данных. Я приложил краткий образец большого набора данных
d = pd.DataFrame({'age': {0: 66.0,
1: 66.0,
2: 66.0,
3: 66.0,
4: 66.0,
5: 66.0,
6: 66.0,
7: 66.0,
8: 66.0,
9: 66.0},
'value': {0: 3000.0,
1: 3000.0,
2: 6000.0,
3: 6000.0,
4: 3000.0,
5: 3000.0,
6: 4500.0,
7: 4500.0,
8: 4500.0,
9: 1900.0},
'start': {0: '1583017200',
1: '1583017200',
2: '1583017200',
3: '1583017200',
4: '1583017200',
5: '1583017200',
6: '1583017200',
7: '1583017200',
8: '1583017200',
9: '1583017200'},
'end': {0: '1583103600',
1: '1583103600',
2: '1583103600',
3: '1583103600',
4: '1583103600',
5: '1583103600',
6: '1583103600',
7: '1583103600',
8: '1583103600',
9: '1583103600'},
'direction': {0: 2.0,
1: 2.0,
2: 2.0,
3: 2.0,
4: 2.0,
5: 2.0,
6: 2.0,
7: 2.0,
8: 2.0,
9: 2.0},
'productA': {0: ['3'],
1: ['3'],
2: ['3', '4'],
3: ['3', '4'],
4: ['3', '4'],
5: ['3', '4'],
6: ['3', '4', '6', '2', '5', '1'],
7: ['3', '4', '6', '2', '5', '1'],
8: ['3', '4', '6'],
9: ['3', '4']}})
Я пытаюсь взорвать столбец productA
из полного набора данных
df_trav.productA = df_trav.product_subtypes.explode()
Я получаю ошибку ниже:
ValueError: cannot reindex from a duplicate axis
Пожалуйста, как мне справиться с такой ошибкой?