Извлечь последнее слово в строке в R - ошибка - PullRequest
0 голосов
/ 01 марта 2020

Сначала я получу sh, чтобы извлечь последнее слово и первое слово для столбца Description (этот столбец содержит не менее 3 слов) во вновь созданный столбец firstword и lastword. Однако функция word () применяется не ко всем строкам. Таким образом, есть много строк с пустым lastword, хотя в действительности у этих строк есть последнее слово (как вы можете видеть из столбца Description). Это показано в первых двух строках кода.

Во-вторых, я также пытаюсь получить третью строку кода для замены lastword на firstword, если lastword пусто. Однако это не работает.

Есть ли способ исправить это?

c1$lastword = word(c1$Description,start=-1) #extract last word
c1$firstword = word(c1$Description,start=1) #extract first word
c1$lastword=ifelse(c1$lastword == " ", c1$firstword, c1$lastword)

Screenshot of dataset - lastword still has missing values

1 Ответ

0 голосов
/ 08 марта 2020

Я понимаю, что в начале некоторых строк переменной Description есть пробел, который не отображается при просмотре в R.

Удаление пробела с помощью stri_trim() решило проблема.

c1$Description = stri_trim(c1$Description, "left") # удалить пробелы

...