openrefine / googlerefine - согласовать два набора данных - PullRequest
0 голосов
/ 23 ноября 2018

Я нахожусь в ситуации с двумя json-файлами: файл A содержит разные данные, один из них содержит числовой идентификатор.Файл B содержит все возможные числовые идентификаторы, связанные с номером чана. В итоговом файле rdf я хотел бы заменить столбец идентификаторов первого файла или добавить другой столбец с соответствующим номером чана.Любое предложение приветствуется, спасибо

РЕДАКТИРОВАТЬ: файл Структура (это массив данных, структурированных так).Поле «поставщики» всегда содержит одно значение, которое является параметром id, о котором я упоминал ранее

{
    "coupon_number": 25422,
    "url": "xxx",
    "title": "Lorem ipsum dolor sit amet, duo ei accusam aliquando rationibus, sed id dolor sensibus delicatissimi.",
    "suppliers": [
        3043
    ],
}

структура файла B (другой массив)

{
    "id": 3043,
    "vatNumber": "03918590401",
}

Мне нужно связать «поставщики»с номером чана или замените его номером чана

1 Ответ

0 голосов
/ 23 ноября 2018

По сути, вам нужно создать два проекта на основе ваших файлов Json, а затем выполнить между ними что-то вроде Vlookup.

Вы упомянули сообщение в блоге, в котором объясняется, как сделать объединение в OpenRefine с помощьюcell.cross(), но этот метод больше не используется.Большинство пользователей скачали Vib-Bit плагин (первый, который можно загрузить с этой страницы), который позволяет вам присоединиться к ним визуально.

Просто распакуйте плагин в папку webapps \ extensions вашего каталога OpenRefine, перезапустите OpenRefine и установите флажок «Редактировать столбцы» -> «Добавить столбцы из другого проекта».

Важноподробно: перед объединением преобразуйте общие строки, содержащие числа (зеленым), в строки (черным).

В следующем снимке экрана показаны операции.

enter image description here

...