Давайте представим, что у меня есть сайт, на котором пользователи создают темы и пишут темы на Fruit.
Чтобы информировать пользователей обо всех разговорах Fruit во всем Интернете, я собираю твиты, связанные с определенной темой, исоздавать темы, основанные на содержании твита.
Очень важно, чтобы твиты относились к теме, очевидно.Допустим, пользователь создает тему под названием «Яблоки и апельсины».Я вытащил все твиты, которые содержат ключевые слова Яблоки и / или Апельсины.
Проблема, с которой я сталкиваюсь, заключается в том, что некоторые пользователи Твиттера пишут твит, включающий, например, ключевые слова: яблоки, апельсины, груши, и он собирается и публикуется как тема в теме обсуждения яблок и апельсинов,Это злит пользователей!
Так что мне нужен способ отфильтровать любой твит, содержащий слова фруктов, кроме яблок и / или апельсинов.
Например, если пользователь твиттера пишет«Я люблю яблоки, апельсины, груши и виноград», тогда этот твит не должен быть включен.
Теперь вы можете только сделать поисковый запрос в Твиттере настолько сложным.Таким образом, логика исключения должна будет выполняться в Ruby после сбора твитов.
Программно, как бы вы решили эту проблему?