Сравнить список векторов с требуемыми совпадениями строк - если не совпадает Удалить DF Row R - PullRequest
0 голосов
/ 17 января 2019

Я заинтересован в создании вектора, содержащего ключевые слова, которые являются правильными заголовками для того, что содержится в столбце категории отдельного фрейма данных. Я хотел бы иметь возможность создать функцию для сравнения столбца категории для совпадений с вектором ключевого слова, и, если их там нет, удаляя неправильную строку из фрейма данных.

Вот пример желаемых ключевых слов:

«Текущая цена акций», «Текущий NAV», «Текущая премия / скидка», «52WkAvg SharePrice», «52WkAvg NAV», «52WkHigh Premium / Discount» и т. Д. И т. Д.

Я пытаюсь удалить несколько крайних случаев из большого стола, где чистка дала такие результаты, как:

"52WkLow NAV 52wLow"

Это происходит из-за отсутствия данных. Кроме того, в качестве проверки избыточности было бы очень полезно распечатать или сохранить, какие полные строки были удалены при очистке.

1 Ответ

0 голосов
/ 17 января 2019

Использование dplyr:

filter(df, category %in% keywords)

(и удаленные строки:)

filter(df, !(category %in% keywords))

Основание:

df[df$category %in% keywords,]

удаленных строк:

df[!(df$category %in% keywords),]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...