Я работаю над огромным объемом данных, строк около 50 миллионов.Я хочу найти уникальные значения столбцов из нескольких столбцов.Я использую приведенный ниже скрипт.
dataAll[['Frequency', 'Period', 'Date']].drop_duplicates()
Но это занимает много времени, более 40 минут.
Я нашел альтернативу:
pd.unique(dataAll[['Frequency', 'Period', 'Date']].values.ravel('K'))
но приведенный выше скрипт даст массив, но мне нужно в кадре данных, как первый скрипт даст как показано ниже