Я хочу создать новый фрейм данных, который отфильтровывает избыточную информацию из предыдущего фрейма данных.Исходный фрейм данных создается путем просмотра множества папок с файлами и предоставления столбца элементов, каждый из которых содержит строку полного пути для доступа к каждому файлу.Каждый файл назван в соответствии с пробным номером и оценкой в соответствующей тестовой папке.Мне нужно удалить все повторения оценок, которые равны 100 для каждого испытания, однако первый счет 100 для каждого испытания должен остаться.
С Python Pandas мне известно об использовании df [df [col_header].str.contains ('text')] для специальной фильтрации того, что необходимо, и использования '~' в качестве логического значения NOT.
Нефильтрованный столбец данных с избыточными значениями выглядит следующим образом
\\desktop\Test_Scores\test1\trial1-98
\\desktop\Test_Scores\test1\trial2-100
\\desktop\Test_Scores\test1\trial3-100 #<- must remove
\\desktop\Test_Scores\test2\trial1-95
\\desktop\Test_Scores\test2\trial2-100
\\desktop\Test_Scores\test2\trial3-100 #<- must remove
\\desktop\Test_Scores\test2\trial3-100 #<- must remove
.
.
.
n
Ожидаемый результат после использования некоторого кода в качестве фильтра - это кадр данных, который выглядит следующим образом
\\desktop\Test_Scores\test1\trial1-98
\\desktop\Test_Scores\test1\trial2-100
\\desktop\Test_Scores\test2\trial1-95
\\desktop\Test_Scores\test2\trial2-100
.
.
.
.
n