R имеет пару функций сходства текста, agrep
и agrepl
, которые похожи на grep
и grepl
в возврате вектора, когда задан вектор. Функция agrepl является логической и имеет ту же длину, что и входные данные, поэтому она лучше работает в таких случаях:
agrepl("Approved", df$text_col) | agrepl("Rejected", df$text_col)
. Это можно использовать для логического индексирования совпадающих строк в кадре данных. Или вы можете сложить логический вектор, чтобы получить счет. Предложение: отредактируйте свой вопрос, используя пример для демонстрации.
Существуют дополнительные параметры, которые можно использовать для регулировки плотности приблизительного соответствия.