Очистка данных о местоположении для Таблицы - PullRequest
0 голосов
/ 05 ноября 2018

Я хочу создать вид карты в Таблице, чтобы подчеркнуть, какие штаты в США больше всего взаимодействуют с New York Times в Интернете. Данные были предоставлены Kaggle, а в одном столбце показаны пользовательские данные о местоположении, введенные пользователями После использования расширенного фильтра в Excel я обнаружил, что существует около 13 000 уникальных значений.

Ex.

  • "NY"
  • "Санта Роза, ок"
  • "Брюссель"
  • "Нигде на самом деле"
  • "В рассоле"
  • "Млечный путь"
  • "Кресскилл, Нью-Джерси"

Формат очень противоречивый. Существуют ли онлайн-руководства или рекомендации по очистке данных о местоположении? Я хочу сохранить как можно больше данных, исключая все бессмысленные данные.

1 Ответ

0 голосов
/ 07 ноября 2018

Если в ваших данных географического местоположения есть шаблон, вы можете попробовать использовать функции REGEX в Таблице, чтобы извлечь нужную часть. Вот краткое описание того, что функции REGEX имеют в Таблице и что они делают: https://onlinehelp.tableau.com/current/pro/desktop/en-us/functions_functions_additional.htm. В противном случае я бы очистил данные, используя другие языки программирования, перед тем как вывести их в Таблицу.

...