Как сделать сопоставление почтового индекса с использованием панд в векторизации? - PullRequest
0 голосов
/ 08 октября 2018

У меня есть серия, содержащая почтовые индексы, такие как

zip_codes = pd.Series(['10001', '1020', '98068'])

Теперь мне нужно сравнить ее с основной таблицей, содержащей все почтовые индексы США, и создать логическую серию, в которой указано, найдено или нет совпадение.

zip_master = pd.DataFrame([['98292', 'Lake Ketchum'], ['98068', 'Roslyn'], ['99013', 99013]], columns=['Zip Code', 'City Name'])

Есть ли векторизованный способ сделать это?Я посмотрел на строковые методы серии здесь , но не смог понять, правильно ли это использовать.

РЕДАКТИРОВАТЬ 1: Согласно комментариям - мы можем использовать метод dataframe isin

Так что мой главный первоначальный вопрос получен.Я хотел бы расширить этот вопрос немного дальше.Возможно ли частичное совпадение строк в векторизованном виде.Скажем, у меня есть серия, содержащая названия городов, и я хочу сопоставить ее с названием города zip master.?Я видел соответствие строк, используемое как здесь - Но оно не векторизовано.Есть ли эффективный векторизованный метод для этого

Должен ли я использовать какой-то другой метод, такой как кэширование или база данных, чтобы сделать это?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...