Как огранить несколько столбцов в Google Refine - PullRequest
3 голосов
/ 05 марта 2012

У меня есть набор данных с 30 столбцами и несколькими строками (в некоторых ячейках нет данных).Я хотел бы иметь возможность разделить колонны на группы.

     1 2 3 4...
Row1 A B C D
Row2 E A D F
Row3 Q A B H  

Учитывая приведенные выше данные, я бы хотел, чтобы фасет переназначил количество экземпляров в группе столбцов.Для первых трех столбцов мне нужно вернуть фасет:

A - 3  
B - 2  
C - 1  
D - 1   
E - 1  
Q - 1 

Я пытался объединить столбцы при загрузке данных, но отдельные данные также были сгруппированы.Это не желаемый результат.Например:

ABC - 1  
EAD - 1  
QAB - 1

Заранее спасибо.

Ответы [ 2 ]

2 голосов
/ 24 апреля 2012

Вы пытались переставить все свои столбцы в один и фасет в этом «главном столбце»?

При транспонировании добавьте имя столбца, чтобы вы знали, откуда поступают данные. Вы можете разделить ваш главный столбец на «исходный столбец» и «данные».

Здесь вы можете найти код JSON для транспонирования большого количества столбцов: http://googlerefine.blogspot.ca/2011/09/json-code-to-transpose-important-number.html

это должно работать для вашего проекта с ограниченным количеством правок.

Надеюсь, это поможет!

2 голосов
/ 07 апреля 2012

Я не могу придумать более эффективный способ сделать это на макушке, но вы можете сделать собственный фасет с чем-то вроде:

[ cells.["1"].value, cells.["2"].value, cells.["3"].value ]

где "1", "2" и "3" - это имена ваших столбцов. Если ваши имена столбцов состоят из отдельных слов, таких как «V1», «V2», «V3» и т. Д., Вы также можете изменить пользовательский фасет на что-то вроде:

[ cells.V1.value, cells.V2.value, cells.V3.value ]

С большим количеством столбцов это решение может быть несколько утомительным, хотя ...

...