Я печатаю фрейм данных, в котором должно быть указано слово, длина и частота в любом простом текстовом документе. У меня все настроено, но 1) длина не учитывает количество символов, я не уверен, что он на самом деле считает; и 2) Мне нужно реорганизовать список слов с самого длинного слова на самое короткое для окончательной печати списка.
file <- c(scan("a.txt",character()))
file <- as.data.frame(table(file))
Freq <- file$Freq
Word <- file$file
Len <- sapply(c(Word),nchar)
Файл плоскости a.txt
со следующим:
the the the bus ran over two two people and when
печатает
Word Len Freq
1 and 1 1
2 bus 1 1
3 over 1 1
4 people 1 1
5 ran 1 1
6 the 1 3
7 two 1 2
8 when 1 1
Len должно быть длиной букв, но здесь он всегда считается 1 - в более длительных тестах он иногда говорит 2, поэтому я не уверен, что он считает. После этого он печатает:
[1] and bus over people ran the two when
Levels: and bus over people ran the two when
Я пытаюсь получить полную печать слова в порядке от самого длинного к самому короткому. Я мог бы использовать Len
для сортировки слов, но я не могу заставить sapply
работать правильно.