Я работаю над проблемой для класса статистики, который использует данные бейсбольной команды, такие как посещаемость, победы / поражения и другие статистические данные о бейсбольных командах.Формулировка задачи требует создания переменных, включающих команды-победители (с 81 или более победами), проигравшие команды (с менее чем 81 победой) и показатели посещаемости по трем категориям, менее 2 миллионов, от 2 до 3 миллионов,и более 3 млн.
Необработанные данные вводятся по имени команды, по одной команде на строку, а затем по статистике в каждом столбце.
Затем мне нужно создать таблицу с количествомколичество команд по этим измерениям, например:
Winning Season Low Attendance Med. Attendance High Attendance
Yes 3 12 3
No 2 10 2
Мы можем использовать любой инструмент, который хотели бы завершить, и я пытаюсь использовать R и RStudio для создания таблицы, чтобы получить знания остатистика и R одновременно.Однако я не могу понять, как это сделать или какие функции использовать для создания таблицы с этими совокупными числами.
Я смотрел на data.table и dplyr и другие, но не могупохоже, выясняют, как подсчитать количество команд по каждой команде.Если бы это был SQL, я смог бы
select count(*) from table where attend < 2000000 and wins < 81
и затем программно создать таблицу.Я не могу понять, как сделать то же самое в R.
Спасибо за любую помощь.