Это мой набор данных, и я пытаюсь выяснить:
- Граница
- Среднее / SD :Среднее и стандартное отклонение для каждой группы.А затем присваивается тот, кто ближе к одной из групп.
- knn : определить ближайших k соседей и к какому классу они принадлежат, назначить на основе того, к какой группе принадлежит большинство соседейявляются частью.
library(ggplot2)
n <- 1000
dfa <- data.frame(
cats=rep(c("A", "B"), each=n),
vals=c(rnorm(n, mean=10, sd=2), rnorm(n, mean=20, sd=2)))
ggplot(dfa, aes(vals, color=cats)) + geom_density()