Я хочу извлечь значения из двух разных столбцов кадра данных pandas, поместить их в список без повторяющихся значений.
Я пробовал следующее:
arr = df[['column1', 'column2']].values
thelist= []
for ix, iy in np.ndindex(arr.shape):
if arr[ix, iy] not in thelist:
thelist.append(edges[ix, iy])
Это работает, но это занимает слишком много времени.Кадр данных содержит около 30 миллионов строк.
Пример:
column1 column2
1 adr1 adr2
2 adr1 adr2
3 adr3 adr4
4 adr4 adr5
Должен генерироваться список со значениями:
[adr1, adr2, adr3, adr4, adr5]
Можете ли выПожалуйста, помогите мне найти более эффективный способ сделать это, учитывая, что фрейм данных содержит 30 миллионов строк.