Я работаю с автомобилем.csv, который можно найти на сайте UCI.Я хочу заменить некоторые NaN в атрибуте нормализованных потерь.Я полагал, что лучший способ сделать это - вычислить среднее значение в соответствии с символикой, потому что символизация влияет на значение нормализованных потерь.
Так что, если NaN имеет символизацию 3, я хочу только среднее значение других нормализованных потерь.которые имеют значение 3 в качестве их символики.Как мне добиться этого?
пример таблицы:
symb norm other attrs
1 100 8017 2
1 90 5019 2
-1 20 8017 1
-1 20 8870 1
1 NaN 8305 3
0 10 8305 3
3 200 8221 3
, поэтому для NaN я хочу получить среднее значение только для других строк с таким же символом
, если я использую
automobile['normalizedlosses'].fillna(automobile['normalizedlosses'].mean(axis=0), inplace=True)
Это заменит все NaN с тем же значением, которое я не хочу