Мне нужно найти способ подсчитать количество повторений значения х, где другое значение столбца у - PullRequest
0 голосов
/ 08 мая 2019

Я использую анализ настроений в Твиттере для набора данных о рейсах авиакомпаний, и в нем есть столбец с именем «отрицательный результат» и другой столбец с именем «авиакомпания».Мне нужно знать, как подсчитать повторения значения «Плохой полет» в столбце «Отрицательный результат». Если название авиакомпании «Virgin America», повторить этот шаг для «Позднего рейса» и «Virgin America», а затем сравнить значения ивыберите большее число и используйте его при построении.

например:

Отрицательный результат Название авиакомпании

Bad Flight Virgin America

Bad Flight Virgin America

Bad Flight Virgin America

Поздний рейс Virgin America

Поздний рейс Virgin America

Bad Flight United

Поврежденный багаж United

Bad Flight United

Поздний рейс United

Поздний рейс United

Bad Flight Virgin America

Bad Flight Virgin America

Поздний полет Virgin America

ожидаемый результат будет 5 для плохого полета и 3 для позднего полета, поэтому после сравнения будет отображаться значение плохого полета.

1 Ответ

0 голосов
/ 08 мая 2019

Если ваш фрейм данных называется df, вы можете просто сделать table(df).

, используя dplyr:

library(dplyr)
df %>% 
  filter(`Airline Name` == "Virgin America") %>% 
  group_by(`Negative Result`) %>% 
  summarize(n = n())
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...