Coldfusion 8 - Проблемы с индексацией больших данных с использованием Verity - PullRequest
1 голос
/ 04 апреля 2011

В настоящее время я работаю с Coldfusion 8, а Verity работает на сервере K2. Я использую запрос для индексации нескольких разных столбцов в моей таблице с помощью cfindex. Одна из колонн представляет собой большой тип varchar.

Похоже, что при индексации данных сохраняются только первые 30 КБ, в результате чего результаты не возвращаются, если я что-то ищу после этого. Я попытался переместить несколько различных фраз и слов дальше в пределах данных, в пределах 30 КБ, и затем появились результаты.

Затем я провел еще несколько тестов на достоверность, используя команду обзора в командной строке, чтобы увидеть, что на самом деле находится в коллекции.

т.е. Coldfusion8 \ verity \ collection \\ parts browse 0000001.ddd

Я обнаружил, что индексируемое тело (CF_BODY) никогда не превышает размер 32000.

Может кто-нибудь сказать мне, есть ли фиксированный размер индекса для документа для достоверности?

Большое спасибо,

Richard

1 Ответ

0 голосов
/ 17 октября 2011

Штриховка

Версия 6 имеет ограничения для операторов :

  • до 32 764 детей в одной "теме" для ЛЮБОГО оператора
  • до 64 детей для NEAR

Превышение эти значения не обязательно дают сообщение об ошибке.Когда вы выполняете поиск, вы уверены, что не превышаете их?

Источник

Документация Verity, Приложение B. Ограничения запросов говорят о двух ограничениях: времени поиска и оператора.Цитата ниже - это целый раздел, рассказывающий о последнем, прямо из книги.

Руководство по языку и теме Verity Query, версия 6.0:

Обратите внимание на следующие ограничения на использование операторов:

Для ЛЮБОГО оператора может быть максимум 32 764 детей.Если тема превышает это ограничение, поисковая система не всегда возвращает сообщение об ошибке.

Оператор NEAR может оценить только 64 дочерних элемента.Если тема превышает это ограничение, поисковая система не возвращает сообщение об ошибке.

Например, предположим, что вы создали большую тему, в которой используется оператор ACCRUE с 8365 дочерними элементами.Этот раздел превышает ограничение 1024 для любой темы класса ACCRUE и ограничение 16000/3 для общего числа узлов.В этом случае вы не можете заменить ЛЮБОЙ на ACCRUE, потому что это приведет к тому, что тема превысит ограничение в 8 000 для максимального числа дочерних элементов для ЛЮБОГО оператора.Вместо этого вы можете построить более глубокую древовидную структуру, сгруппировав темы и создав несколько именованных подузлов.

...