Как отфильтровать местоположения в CSV-файле с помощью Python или Tableau prep? - PullRequest
0 голосов
/ 30 апреля 2020

У меня есть CSV-файл с 20K твитов, столбцом которого является местоположение пользователя. локации из всех регионов мира, но для нас важны только штаты америки. Снимок экрана набора данных выглядит следующим образом: enter image description here

Как отфильтровать этот файл, чтобы сохранить только те строки, данные о местонахождении которых находятся у пользователя в штате Америка, Python или в таблице Prep? (удалить все строки, которые находятся не в США)

1 Ответ

1 голос
/ 01 мая 2020
import pandas as pd 

df = pd.DataFrame(['Usa','Australia','Asia','Africa','Europe'],columns = ['continent'])


# make a list of word you want to filter 

list_ = ['Asia','Europe','Africa']


# now you can use pandas isin functionality to filter the data that you want

df.loc[df['continent'].isin(list_)]

#op
    continent
2   Asia
3   Africa
4   Europe
...