Моя структура: в каждой категории есть тексты. Эти тексты являются собственными записями. Итак, таблица «категория» и таблица «тексты». В каждой категории около 90 текстов, каждый текст содержит около 300 символов.
Что я хочу сделать, это сделать мета-теги (ключевые слова) для категорий. Как> получить все релевантные «тексты», оценить все слова и взять 10 лучших слов. Эти первые 10 будут мета-тегом ключевого слова категории.
Теперь .. хитрость> как получить эти 10 лучших слов. В настоящее время> у меня есть, что каждый текст (является полным текстом) будет разделен на массив для каждого слова. Этот массив (в php) будет довольно длинным. После этого я беру частоту каждого слова и снова оцениваю его по частоте. Вуаля топ 10 слов.
Я не тестировал эту процедуру, но думаю, что это может занять немного. Он будет кэширован, поэтому запускать его придется только раз в неделю или около того, но все же я не хотел бы получать тайм-аут.
У вас есть какие-нибудь советы? Любая помощь приветствуется.
Спасибо
Maurice