Условная замена в панде - PullRequest
0 голосов
/ 28 апреля 2018
new_df['year'].describe()

count    10866.000000
mean      2004.009939
std         14.958790
min       1968.000000
25%       1996.000000
50%       2006.000000
75%       2012.000000
max       2067.000000
Name: year, dtype: float64

Кажется, что ошибочные значения года составляют +100 лет (т. Е. 2067, вероятно, должно быть 1967). Следовательно, для значений выше 2018, как мне [год - 100], оставляя остальные значения нетронутыми?

1 Ответ

0 голосов
/ 28 апреля 2018

Вы можете использовать pd.DataFrame.loc:

new_df.loc[new_df['year'] > 2018, 'year'] -= 100
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...