Я объединил два кадра данных, но теперь есть повторяющиеся строки.Я хочу переместить мои строки в столбцы, основанные на / сгруппированные по значению столбца.
Я уже объединил два кадра данных:
df_merge = pd.merge(top_emails_df, keyword_df, on='kmed_idf')
Новый кадр данных выглядит следующим образом:
import pandas as pd
df = pd.DataFrame({'kmed_idf': ['1', '1', '1', '2', '2'],
'n_docs': [796, 796, 796, 200, 200],
'email_from: ['foo', 'foo', 'foo', 'bar', 'bar'})
Я попытался сложить фрейм данных:
newtest = df_merge.set_index(['kmed_idf']).stack(level=0)
newtest= newtest.to_frame()
Но это только создало серию.Когда он конвертируется в фрейм данных, он все еще не очень полезен.
То, что я хотел бы, это фрейм данных, где каждая строка представляет собой уникальное значение kmed_idf, а строки теперь являются столбцами.Примерно так:
import pandas as pd
df = pd.Dataframe({'kmed_idf': ['1', '2', '3'],
'n_docs': [796],
'n_docs2': [796],
'n_docs3,: [796]})
Это облегчит удаление дубликатов.Я также пытался использовать функцию удаления дубликатов панд, но безрезультатно.