Пометка большого списка поисков, который содержит ключевые слова, используя grep & apply - R / Tidyverse - PullRequest
0 голосов
/ 27 сентября 2019

Привет, ребята. У меня есть такой набор данных

+----+------------------------+
| id |         search         |
+----+------------------------+
| x1 | restaurants nearby     |
| x2 | italian food nearby    |
| x1 | french food            |
| x3 | pizza pizza            |
| x5 | fresh fruits           |
| x2 | ice cream cones        |
| x3 | how to make pasta      |
| x2 | pasta pizza nearby     |
| x5 | chocolate cake         |
| x4 | whats the weather like |
| …  |                        |
+----+------------------------+

и список ключевых слов, подобных этому

+--------------+
|   keywords   |
+--------------+
| italy        |
| italian      |
| italian food |
| pizza        |
| pasta        |
| …            |
+--------------+

, и вот результат, который я ищу:

+----+------------------------+------------------+
| id |         search         | italian searches |
+----+------------------------+------------------+
| x1 | restaurants nearby     | SEARCH_OTHER     |
| x2 | italian food nearby    | SEARCH_ITALIAN   |
| x1 | french food            | SEARCH_OTHER     |
| x3 | pizza pizza            | SEARCH_ITALIAN   |
| x5 | fresh fruits           | SEARCH_OTHER     |
| x2 | ice cream cones        | SEARCH_OTHER     |
| x3 | how to make pasta      | SEARCH_ITALIAN   |
| x2 | pasta pizza nearby     | SEARCH_ITALIAN   |
| x5 | chocolate cake         | SEARCH_OTHER     |
| x4 | whats the weather like | SEARCH_OTHER     |
| …  |                        |                  |
+----+------------------------+------------------+ 

У меня ~ 20 млн записей и ~ 100 тыс. Ключевых слов.Может ли кто-нибудь помочь мне добиться этого как можно быстрее?

Я знаю, что мне нужно использовать grep и одну из функций применения.

Любая помощь приветствуется.Спасибо:)

...