фильтровать несколько строк в любом месте одного столбца - PullRequest
0 голосов
/ 11 февраля 2020

У нас есть несколько столбцов во фрейме данных. В одной колонке у нас есть название компании и название города. Я хотел отфильтровать данные с названием города в конце значения столбца или где-либо еще.

Например: введите, как показано ниже

TCS bangalore

Wipro global Бангалор

Бангалор консультант Индия частный ограниченный

Infosys chennai

системы bangalore pvt ltd

Рабочая сила

Талант Дели

Интеллектуальные технологии ограничены

HCL

Amazon Kochi

Paytm

Индия сегодня

Ожидаемый объем производства

TCS bangalore

Wipro global Бангалор

Бангалор консультант Индия частный ограниченный

Infosys chennai

systems bangalore pvt ltd

Рабочая сила Хайдарабад

Талант Дели

Амазон Кочи

1 Ответ

0 голосов
/ 11 февраля 2020

Вам понадобится вектор всех возможных городов. Например:

cities <- c("Bangalore","Chennai","Delhi","Kochi","Mumbai","London","Madrid")

Затем, предполагая, что ваш фрейм данных называется «data» со столбцом «Company», следующая команда должна возвращать только те строки, в которых Company содержит один из городов:

library(dplyr)

data %>% 
filter(grepl(paste(cities, collapse="|"), Company))

Функция grepl выполняет сопоставление с образцом для вас.

...