Я новичок в питоне и в Пандах. Итак, у меня есть следующий сценарий.
Фрейм данных (df) выглядит так:
col1 col2 col3 col4 col5 col6
0 x1 y1 z1 f1 e1 g1
1 x2 y2 z2 f2 e2 g2
Существующий код подобен следующему:
items = set()
...
for item in df['col3'].tolist():
if item not in items:
items.add(item)
Набор "items" записывается в файл. В настоящее время выходной файл содержит только один столбец ... "col3" примерно так.
Файл: items.txt
col3
z1
z2
Новое требование заключается в записи col3 и col5 в файл. Теперь дополнительным требованием является то, что значение col5
также должно быть зафиксировано для соответствующего значения col3
.
Файл: items.txt
col3 col5
z1 e1
z2 e2
Я попытался создать еще один dataframe
со следующим:
df1 = df[['col3', 'col5']]
но сейчас я потерян.
Любая помощь приветствуется.
Спасибо,
Anoop