Я предполагаю, что столбец language
- это текст, а не фактор. В этом случае есть много вариантов, но проще всего использовать следующий код:
new_df <- merged_Df[merged_Df$language %in% c("english", "indonesian", "scots"), ]
Теперь для подсчета вы можете использовать этот простой, но утомительный код:
english_cnt <- sum(merged_Df$language == "english")
indonesian_cnt <- sum(merged_Df$language == "indonesian")
scots_cnt <- sum(merged_Df$language == "scots")
или немного продвинутый, но более общий
aggregate(x=new_df[, "language"], by=list(language = new_df$language), FUN=length)
Надеюсь, это поможет.