Question

У меня есть задача, где мне нужно очистить свои данные с помощью дубликатов записей, но в то же время заполнить эти ячейки с помощью значений Nan с такими же именами, например:

id          id2      name   other_n        date       country
1.177.002   nan test_name    nan     8 decembre 1981    usa
1.177.002   A   test_name   ALVA        nan             nan

До сих пор я пробовал обычный групповой режим, но не получил ожидаемый результат

tst.groupby('name').mean()
tst.groupby('name').sum()

Результат, который я ищу, должен выглядеть примерно так:

id          id2      name   other_n        date       country
1.177.002   A   test_name    ALVA     8 decembre 1981   usa

Valdi_Bo · Answer 1 · 01 февраля 2020

Run:

df.groupby('name', as_index=False)\
    .agg(lambda col: col.loc[col.first_valid_index()])\
    .reindex(df.columns, axis=1)

Окончательный reindex необходим, чтобы вернуть порядок столбцов к тому, как они упорядочены в исходном DataFrame. В противном случае имя будет перемещено на первое место

Группировка данных для завершения записи между собой

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Группировка данных для завершения записи между собой

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы