Поскольку мы смотрим только на распределение одной переменной ("Положение"), а не на соотношение между двумя переменными , то, возможно, гистограмма будет более подходящим графиком. ggplot имеет geom_histogram () , что упрощает:
ggplot(theTable, aes(x = Position)) + geom_histogram(stat="count")
Использование geom_histogram ():
Я думаю, geom_histogram () немного странно, так как обрабатывает непрерывные и дискретные данные по-разному.
Для непрерывных данных вы можете использовать geom_histogram () без параметров.
Например, если мы добавим в числовой вектор «Оценка» ...
Name Position Score
1 James Goalkeeper 10
2 Frank Goalkeeper 20
3 Jean Defense 10
4 Steve Defense 10
5 John Defense 20
6 Tim Striker 50
и использовать geom_histogram () в переменной «Score» ...
ggplot(theTable, aes(x = Score)) + geom_histogram()
Для дискретных данных , таких как «Положение», мы должны указать вычисляемую статистику, вычисляемую эстетикой, чтобы получить значение y для высоты столбцов, используя stat = "count"
:
ggplot(theTable, aes(x = Position)) + geom_histogram(stat = "count")
Примечание: Любопытно и запутанно, вы также можете использовать stat = "count"
для непрерывных данных, и я думаю, что это обеспечивает более эстетичный график.
ggplot(theTable, aes(x = Score)) + geom_histogram(stat = "count")
Правки : расширенный ответ в ответ на полезные предложения DebanjanB .