Управление столбцами и строками .xls с помощью Open Refine - PullRequest
0 голосов
/ 01 июля 2018

Мне нужно манипулировать набором данных, чтобы его можно было сопоставить с помощью Google Fusion Tables. Текущие данные xls форматируются следующим образом:

Изображение файла xls с анонимными персональными данными

Обратите внимание, что пустая строка указывает на новую запись. Мне нужно, чтобы информация в столбце была отсортирована в строки под соответствующим заголовком, в частности адрес для геокодирования. Есть идеи?

1 Ответ

0 голосов
/ 03 июля 2018

Сначала выполните очистку, чтобы объединить второй и третий столбцы в один, а затем используйте функцию Columnize by key/value column, чтобы преобразовать данные в третьем и четвертом столбцах в отдельные поля.

После этого таблица Fusion сможет геокодировать набор данных на основе адреса. Если это не так, существует множество обучающих программ для геокодирования набора данных с помощью OpenRefine. См:

...