Разделенный столбец OpenRefine с повторяющимися значениями - PullRequest
0 голосов
/ 12 февраля 2020

У меня есть один столбец в OpenRefine, например:

Title
A Star is born
Author
George Cukor
Date
1954
Other tags...

Данные для каждого элемента начинаются с имени тега (Название, Автор, Дата и т. Д. c.), За которым следует значение, и каждый тег или значение находятся в последовательных строках, около десяти тысяч. Я хотел бы иметь столько столбцов, сколько тегов и столько строк, сколько элементов, содержащих заголовок, дату, автора и т. Д. c. Примерно так:

Title | Author | Date | etc.
A Star is born | George Cukor | 1954 | etc.

Есть идеи? Спасибо

1 Ответ

0 голосов
/ 12 февраля 2020

Это ваш исходный набор данных:

enter image description here

Используйте «Транспонировать -> Транспонировать ячейки в строках в столбцы» (оставив опцию 2 по умолчанию) , Вы получите это:

enter image description here

Затем в первом столбце примените «Транспонировать -> Столбить по столбцам ключ / значение» и не измените параметры по умолчанию там тоже. Окончательный результат:

enter image description here

Очевидно, что это будет работать с большим количеством тегов / столбцов, но только если за каждым из них следует одно значение.

...