У меня есть список массивов numpy, и я пытаюсь объединить их в 2d матрицу следующим образом:
[arr1, arr2, arr3....]
arr1 = [0.24, 0.24, 0.56, 0.77]
arr2 = [0.1, 0.24]
arr3 = [0.6, 0.7, 0.72, 0.88]
Вот как должен выглядеть вывод:
NaN, 0.24, 0.24, 0.56, Nan, Nan, Nan, 0.77, Nan
0.1, 0.24, Nan, Nan, Nan, Nan, Nan, Nan, Nan
Nan, Nan, Nan, Nan, 0.6, 0.7, 0.72, NaN, 0.88
Я использую следующий скрипт для их объединения:
# convert to series
series = [pd.Series(arr,index=arr) for arr in arrs]
# concat with reindex
pd.concat(series, axis=1)
Но я сталкиваюсь со следующей ошибкой:
raise ValueError("cannot reindex from a duplicate axis")
ValueError: cannot reindex from a duplicate axis
Обратите внимание, что входные массивы имеют дубликаты внутри, и я быкак сохранить эти дубликаты.
Как мне исправить это?
РЕДАКТИРОВАТЬ:
учитывая обсуждение в комментариях, ошибка, скорее всего, возникает из-за дубликатов, и я надеялся найти обходной путь, который.