Как отсортировать уникальную таблицу в датафрейме по одному столбцу? - PullRequest
0 голосов
/ 22 февраля 2019

имеют df со значениями

    0     |     1   |     2
0  sun    |   east  |   pass 
1  moon   |   west  |   pass
2  mars   |   north |   pass
3  saturn |   east  |   pass
4  neptune|   west  |   pass

Необходимо получить отчетливый df, просматривая значения в 1 столбце.Здесь в столбце 1 есть два восточных и два западных, и их значения 0 различны.

вывод должен быть

  0       |     1   |     2
0  sun    |   east  |   pass 
1  moon   |   west  |   pass
2  mars   |   north |   pass


              or


    0       |     1   |     2
0  saturn   |   east  |   pass 
1  neptune  |   west  |   pass
2  mars     |   north |   pass

, поэтому для вывода требуется только одно значение в столбце 0, а не оба.тут нужны солнце и луна (или) сатурн и нептун.

1 Ответ

0 голосов
/ 22 февраля 2019

Я считаю, что вам нужно groupby с join - только необходимые одинаковые значения 2 столбец для групп:

df = df.groupby([1,2], sort=False)[0].apply(' (or) '.join).reset_index().sort_index(axis=1)
print (df)
                   0      1     2
0    sun (or) saturn   east  pass
1  moon (or) neptune   west  pass
2               mars  north  pass
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...