Если я хочу подсчитать совпадающие слова в строках двух таблиц с миллионами строк, пример:
Стол сообщений, образец:
+----+---------+-----------------------------+
| ID | ID_user | text |
+----+---------+-----------------------------+
| 1 | bruno | michael jackson is dead |
| 2 | thomasi | michael j. moonwalk is dead |
| 3 | userts | michael jackson lives |
+----+---------+-----------------------------+
Я хочу запросить слова, наиболее часто повторяющиеся в таблице, ограничить число первых 10, результат может быть следующим:
+-------+------------+
| count | word |
+-------+------------+
| 3 | michael |
| 2 | dead |
| 2 | jackson |
| 1 | j. |
| 1 | lives |
| 1 | moonwalk |
+-------+------------+
но я хочу искать только слова, которые повторяются более 10 раз, в этом случае ни одно слово не появляется, но если критерий для повторных слов равен 2, будет отображаться только «michael» и «dead», но игнорировать «is», потому что я не хочу слова с менее чем 2 символами длины и слова, которые фраза, тогда мне нужно вывести это:
+-------+-----------------+
| count | word |
+-------+-----------------+
| 2 | michael jackson |
| 2 | dead |
+-------+-----------------+
мне нужен код в mysql, который отвечает на «актуальные темы» в твиттере за сообщения моего сайта.