Я поставлен в тупик о том, как подойти к конкретной проблеме. По сути, я sh хочу сделать следующее:
Используя pandas, я хочу перебрать строки и, если значение в поле None / NaN, добавить имя поля к новое поле, как показано ниже.
+----+--------+----------+--------+--------+--------+---------------------------------+
| ID | Animal | Building | Letter | Fruit | Number | NullFields |
+----+--------+----------+--------+--------+--------+---------------------------------+
| 1 | Dog | House | C | null | 4 | Fruit |
| 2 | null | House | null | Apple | null | Animal, Letter, Number |
| 3 | Cat | null | B | Orange | null | Building, Number |
| 4 | null | null | null | null | 6 | Animal, Building, Letter, Fruit |
| 5 | Snake | null | A | null | 7 | Building, Fruit |
+----+--------+----------+--------+--------+--------+---------------------------------+
Выше я набрал 'null' для удобства чтения. Я знаю, что None / NaN - это не одно и то же, но данные, с которыми я имею дело, похоже, имеют и то, и другое. Если мне нужно запустить fillna
, это нормально.
Я не думаю, что np.where
сработает здесь, если я что-то упустил. Я не знаю, нужно ли мне вместо этого использовать iterrows
или как.
Любые советы / рекомендации будут высоко оценены!