Question

В DF у меня есть два столбца (давайте назовем их A и B), где A имеет повторы, оба являются категориальными переменными. Я пытаюсь показать только уникальные строки A с соответствующими значениями B, как я могу это сделать?

Я смог сделать это, когда B - непрерывная переменная, используя это:

by(ptable, [:A], df -> mean(df[:B]))

Bogumił Kamiński · Answer 1 · 30 августа 2018

Вы можете получить желаемый результат следующим образом:

by(df, :A, x -> [x.B])

теперь ваш DataFrame будет иметь два столбца :A и :x1, а столбец :x1 будет содержать все значения столбца :B, соответствующие уникальным значениям :A (поэтому столбец :x1 будет вектор векторов).

Юлия ДатаФреймы Уникальные Строки

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Юлия ДатаФреймы Уникальные Строки

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы