Заполнение пропущенных данных с использованием расчета из существующих данных столбца - PullRequest
0 голосов
/ 27 апреля 2020

Встреча с небольшой проблемой. Работа над хранилищем машинного обучения UCI (ILPD в спецификациях c) В одном столбце 4 пропущенных значения. Вместо вменения со средним или медианным, это может быть разработано с использованием простой формулы из существующих данных столбца.

Попытка заполнить отсутствующие данные для соотношения альбумина и глобулина следующей формулой альбумин / (общее количество белков - альбумин), однако следующий код продолжает сталкиваться с ошибками.

IndianLiver['Albumin Globulin Ratio']
.fillna(IndianLiver.groupby('Class')['Albumin Globulin Ratio']
.transform(['Albumin']/(['Total Proteins']-['Albumin']), inplace=True)

SyntaxError: unexpected EOF while parsing

Есть мысли?

Спасибо

1 Ответ

0 голосов
/ 03 мая 2020

Удалось исправить это, казалось, отсутствовало имя кадра данных в столбцах, вызванных при вычислении в конце:

    Albumin_Globulin_Ratio = IndianLiver['AG Ratio'].fillna(IndianLiver['Albumin']/(IndianLiver['Total Proteins']/IndianLiver['Albumin']))

Это теперь заполняет 4 отсутствующие точки данных в столбце, используя существующие столбцы рассчитать недостающие точки данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...