Поиск трендов в нагрузках текстовых данных - PullRequest
2 голосов
/ 13 мая 2009

У меня большая таблица, и я хотел бы хотя бы найти наиболее повторяющиеся работы, чтобы иметь список ключевых слов с тенденциями.

База данных mysql, и я запускаю php5.

Есть ли другой способ, кроме взрыва данных и поиска повторов на стороне php?

А как насчет сочетания 2/3 слов ключевых трендов?

Есть мысли?

Ответы [ 2 ]

2 голосов
/ 13 мая 2009

хорошо ... так как я не получил никаких ответов, я нашел способ, используя php:

$wordfrequency = array_count_values( str_word_count( $string, 1) );

надеюсь, это кому-нибудь поможет:)

1 голос
/ 14 мая 2009

Похоже, вы почти говорите о реализации алгоритма цепочки Маркова . Однако без полной обработки данных я не могу придумать, каким образом вы могли бы использовать только SQL для выполнения таких трендов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...