Создавать элементы викиданных из записей в OpenRefine (а не строк)? - PullRequest
1 голос
/ 10 октября 2019

Я прочитал, что плагины OpenRefine Wikidata всегда работают в режиме строк .

Я нахожусь в ситуации, когда у меня есть данные в режиме записей: запись представляет собой сериал / журнал, иСтроки в этих записях представляют различные форматы одного и того же сериала / журнала (обычно бумажная и электронная версия). Каждая строка имеет уникальный идентификатор ISSN. Wikidata считает, что для сериала / журнала (мои записи) есть только один элемент, но нет отдельных элементов для каждого из форматов (мои строки).

При согласовании данных с Wikidataвсе строки одной и той же записи обычно соответствуют одному и тому же элементу викиданных, или ни одна из строк не будет соответствовать, или иногда будет совпадать только одна строка записи (например, если только один ISSN формата - скажем, бумажный формат - известен вВикиданные, но не остальные).

enter image description here

Я хотел бы создать элементы в Викиданных для каждой записей длякоторый не был найден результат сверки (iow, для которого не найдено ни одной строки), а не для каждой строки . И при создании этого элемента я хотел бы добавить номера ISSN всех строк в этой записи.

Мне интересно, возможно ли это сделать? и как?

спасибо

1 Ответ

0 голосов
/ 10 октября 2019

Да, это возможно. Вместо этого вам необходимо выполнить операцию согласования первого столбца.

  • Как указано в документации, используйте операцию Fill down в первом столбце, который определяет ваши записи;
  • Согласуйте столбец с Wikidata;
  • Затем Создайте один новый элемент для похожих ячеек action (в Reconcile -> Actions меню)
  • Создайте схему, в которой первый столбец используется в качестве идентификатора субъекта.

Предполагается, что значения в первом столбце изначально различны (что имеет место в вашейпример), это создаст один элемент для каждой записи.

В вашем примере, поскольку ваш первый столбец содержит номера ISSN, а не заголовки, я сначала вместо этого создал бы корневой столбец с заголовками (до процесса, описанного выше). В режиме строк сохраните фасет для сохранения первой строки каждой записи, выбрав непустые значения в первом столбце, а затем скопируйте столбец с заголовками и переместите этот новый столбец на первую позицию. Это должно гарантировать, что примирение подбирает существующие предметы. Обратите внимание, что если один и тот же заголовок используется несколькими журналами, это создаст один элемент для них обоих, если только вы не добавите другие свойства в конфигурацию сверки (например, ISSN).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...