Есть ли функция GREL OpenRefine для выявления и удаления столбцов, не содержащих записей - PullRequest
0 голосов
/ 28 мая 2020

У меня большой проект с множеством столбцов. Некоторые столбцы имеют записи, но многие столбцы не имеют записей. Есть ли способ определить, какие столбцы полностью пусты, а затем удалить эти столбцы? Можно ли написать это действие в GREL для применения ко всему проекту в одном go?

В настоящее время используется OpenRefine версии 2.8

1 Ответ

0 голосов
/ 28 мая 2020

Вы можете идентифицировать столбцы, в которых нет значений, но вы не можете удалить их автоматически.

В OpenRefine 2.8 вы можете создать фасет настраиваемого текста для любого столбца с помощью GREL:

filter(row.columnNames,cn,isBlank(cells[cn].value))

Это создаст фасет, в котором перечислены все столбцы, где счетчик представляет собой количество пустых значений в этом столбце. Если это количество совпадает с количеством строк в проекте, в этом столбце есть только пустые ячейки.

В OpenRefine 3.2 и выше фасет доступен непосредственно в раскрывающемся меню в столбце «Все»

К сожалению, после определения столбцов, содержащих только пустые значения, ваш единственный вариант - удалить их, используя обычные механизмы удаления столбцов в OpenRefine - нет способа написать GREL, который идентифицирует столбцы и удаляет их.

...