У меня есть файл csv, который я читаю в кадре данных Python Pandas. Я хочу векторизовать операцию для запуска очистки данных в столбцах с набором пользовательских функций для определенных столбцов и добавить результаты к кадру данных.
Я могу читать записи и обрабатывать их 1 на 1, но хочу векторизовать операцию с помощью функции Pandas, работающей с целым столбцом 1 *.
Входной кадр данных
A B C D
0 a b c d
1 t f h e
2 j r y k
Я хочу выполнить очистку данных (DC*
) для столбцов столбцов A, B and C
.
A B C D DC1-A DC2-B DC3-D
0 a b c d 1 0 -1
1 t f h e 1 -1 0
2 j r y k 0 1 1
Приведенная выше матрица показывает, какие данные были очищены, а какие нет. В столбцах DC1-A, DC2-B and DC3-B
значения 1 показывают, что данные очищены, 0 - данные, которые не нужно очищать, и -1 данные не могут быть очищены.