Удаление всех символов после специального символа в имени столбца - PullRequest
0 голосов
/ 02 мая 2019

У меня есть набор данных, который я импортировал в R, но мне нужно избавиться от всего в именах столбцов после "(". Я пробовал string.split(), sub(), and grepl() функций, но безуспешно. Любая и вся помощь будет ценится!

Я бы хотел, чтобы это стало следующим:

Фрукты => Фрукты

Овощи (мало) => Овощи

Хлебные крошки => Хлебные крошки

Сыр (Чеддер) => Сыр

Йогурт (Обычный%) => Йогурт

Ответы [ 2 ]

0 голосов
/ 03 мая 2019

Использование базы R:

items <- c('Fruit', 'Vegetables (Few)', 'Bread Crumbs', 'Cheese (Cheddar)', 'Yogurt (Plain%)')
items_simplified <- trimws(gsub('\\(.*', '', items))

> items_simplified
[1] "Fruit"        "Vegetables"   "Bread Crumbs" "Cheese"       "Yogurt"   

Вы также можете использовать stringr из пакета tidyverse:

library(stringr)
items_stringr <- str_trim(str_extract(items, '[^(]*'))

> items_stringr
[1] "Fruit"        "Vegetables"   "Bread Crumbs" "Cheese"       "Yogurt"      

trimws и str_trim убирают конечные и начальные пробелы из элементов.

0 голосов
/ 02 мая 2019

Используйте регулярное выражение или регулярное выражение

Как: /(.+)/g

И удалите все, что найдено

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...