Я хочу создать вид карты в Таблице, чтобы подчеркнуть, какие штаты в США больше всего взаимодействуют с New York Times в Интернете. Данные были предоставлены Kaggle, а в одном столбце показаны пользовательские данные о местоположении, введенные пользователями После использования расширенного фильтра в Excel я обнаружил, что существует около 13 000 уникальных значений.
Ex.
- "NY"
- "Санта Роза, ок"
- "Брюссель"
- "Нигде на самом деле"
- "В рассоле"
- "Млечный путь"
- "Кресскилл, Нью-Джерси"
Формат очень противоречивый. Существуют ли онлайн-руководства или рекомендации по очистке данных о местоположении? Я хочу сохранить как можно больше данных, исключая все бессмысленные данные.