Фильтрация данных по значениям в столбцах в панде - PullRequest
0 голосов
/ 23 сентября 2018

Я работал над некоторыми данными в последнее время.В процессе фильтрации я обнаружил, что некоторые столбцы имеют некоторые проблемы.Я хочу сохранить только те строки, которые имеют ')', присутствующие в последних столбцах Ветви.

Я пробовал несколько вариантов, но я хочу найти самый быстрый способ обойти это.

This is a part of the data on which i have been working on.

1 Ответ

0 голосов
/ 23 сентября 2018

Поскольку вы не предоставили свои данные в виде текста, я создал пример кадра данных:

Ввод:

d = {'college_name': ['College {}'.format(i+1) for i in range(8)], 'branch': ['Civil Enigineering '+ '(4 Years)'*(i%2) for i in range(8)]}
df = pd.DataFrame(data=d, columns=['college_name','branch'])
df

Вывод:

    college_name    branch
0   College 1   Civil Enigineering
1   College 2   Civil Enigineering (4 Years)
2   College 3   Civil Enigineering
3   College 4   Civil Enigineering (4 Years)
4   College 5   Civil Enigineering
5   College 6   Civil Enigineering (4 Years)
6   College 7   Civil Enigineering
7   College 8   Civil Enigineering (4 Years)

Серия Pandasимеют встроенные методы обработки строк.Вы можете использовать str.endswith (')') для фильтрации ваших данных.Обратите внимание, что df['branch'].str.endswith(')') вернет логическую маску.

Ввод:

df[df['branch'].str.endswith(')')]

Выход:

    college_name    branch
1   College 2   Civil Enigineering (4 Years)
3   College 4   Civil Enigineering (4 Years)
5   College 6   Civil Enigineering (4 Years)
7   College 8   Civil Enigineering (4 Years)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...