Question

Привет. Я пытаюсь получить среднее значение дубликатов строк выборки внутри фрейма данных.Я могу вывести среднее значение для всех столбцов в двух строках, однако некоторые из моих столбцов содержат текст внутри - это приводит к большому количеству NA.Как я могу обойти это?

dwhdai · Answer 1 · 31 января 2019

Если строки действительно дублированы (как, например, все значения одинаковы), и при условии, что у вас есть переменная идентификатора, которая группирует эти дублированные строки, то вы можете просто взять первую строку для каждого идентификатора.

Примерно так может работать:

library(dplyr)
new_data <- duplicated_data %>%
  group_by(ID) %>%
  slice(1) %>%
  ungroup()

Где duplicated_data - ваш исходный набор данных, а ID - переменная идентификатора, которую вы используете, чтобы определить, дублирован ли образец или сейчас.

R Возьмите среднее значение повторяющихся строк в наборе данных, когда текст некоторых столбцов в

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

R Возьмите среднее значение повторяющихся строк в наборе данных, когда текст некоторых столбцов в

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов