Я использую набор данных о жилье для машинного обучения. пытаясь уменьшить размеры набора данных, я хотел объединить 2 столбца, а именно 'yr_built' и 'yr_renovated', в новый столбец age (of the house).
я пытаюсь создать новый столбецвозраст из 2 предопределенных столбцов ((year_built) и (year_renovated)). в столбце обновленного года указаны значения, например, год (например, 1991 год, если отремонтирован) или 0, если он не отремонтирован.
Логика, которую я здесь пытаюсь использовать, заключается в том, что если ремонт произошел, то возраст здания - текущий год - годобновление, т. е.
[age = 2019 - year_renovated]
Если ремонт не проводился: возраст здания - текущий год - год строительства, т. е.
[age = 2019 - year_built]
изображение новых данных отображается на следующем рисунке
Я попытался использовать цикл for для того же самого, и код выглядит следующим образом:
кадр данных находится во вложении этой картинки
for i in pp['age']:
if pp['yr_renovated'] = 0:
ppnew['age'] = 2019 - pp['yr_built']
else:
ppnew['age'] = 2019 - pp['yr_renovated']
и я также пытался использовать
for i in pp['age']:
if pp['yr_renovated'] == 0: #truth value
ppnew['age'] = 2019 - pp['yr_built']
else:
ppnew['age'] = 2019 - pp['yr_renovated']
ошибка говорит о логической ошибке
PLZ помочь с кодом.
спасибо