Юлия ДатаФреймы Уникальные Строки - PullRequest
0 голосов
/ 30 августа 2018

В DF у меня есть два столбца (давайте назовем их A и B), где A имеет повторы, оба являются категориальными переменными. Я пытаюсь показать только уникальные строки A с соответствующими значениями B, как я могу это сделать?

Я смог сделать это, когда B - непрерывная переменная, используя это:

by(ptable, [:A], df -> mean(df[:B]))

Ответы [ 2 ]

0 голосов
/ 30 августа 2018

Это сработало для меня

df[!nonunique(df[:,[:A]]), [:A, :B]]
0 голосов
/ 30 августа 2018

Вы можете получить желаемый результат следующим образом:

by(df, :A, x -> [x.B])

теперь ваш DataFrame будет иметь два столбца :A и :x1, а столбец :x1 будет содержать все значения столбца :B, соответствующие уникальным значениям :A (поэтому столбец :x1 будет вектор векторов).

...