найти в фильтрации данных кадров, занимающих много времени - PullRequest
0 голосов
/ 30 апреля 2018

У меня есть дата-фрейм Emp (детали занятости), имеющий 3 500 000 строк и 5 столбцов. Я должен фильтровать Dataframe на основе Emp_Name == "Джон". Я использую loc для этой цели. Но этот шаг занимает несколько часов. Каков наилучший и самый быстрый способ фильтрации данных с огромным набором данных?

Emp_subset=Emp.loc[Emp['Emp_Name'] == "John"]

1 Ответ

0 голосов
/ 30 апреля 2018

Это не должно занять так много времени. Здесь нет необходимости использовать loc.

Попробуйте и посмотрите, насколько это ускоряет процесс:

emp_subset=Emp[Emp['Emp_Name'] == "John"]

Также старайтесь не использовать заглавные буквы для имен объектов df, так как это может привести к путанице: https://www.python.org/dev/peps/pep-0008/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...