Какова роль краулера в индексе восстановления Coveo - PullRequest
2 голосов
/ 18 июня 2020

Пока мы выполняем перестройку индекса в Sitecore для Coveo, как сканер Coveo работает внутри и публикует sh элементы в Coveo Cloud?

1 Ответ

2 голосов
/ 11 июля 2020

Сканер - это модуль Coveo Cloud, который сканирует элементы для индексации и извлекает их содержимое. Если элемент защищен, сканер также извлекает его разрешения и сохраняет их как метаданные элемента.

Конфигурации искателя Coveo для Sitecore по умолчанию определены в Coveo.SearchProvider.config, и по умолчанию Coveo для Sitecore индексирует весь контент и элементы мультимедиа под /sitecore/content и /sitecore/media library/Files соответственно. Вы можете исправить эти конфигурации в Coveo.SearchProvider.Custom.config, изменив сканирование root ваших индексов, чтобы предотвратить индексирование нежелательных элементов в определенных c индексах и / или добавив новое сканирование root.

Coveo для Sitecore использует стратегии обновления индекса Sitecore для автоматического индексирования элементов Sitecore. Созданные, удаленные и измененные элементы в базе данных master индексируются по мере возникновения этих событий. В базе данных web опубликованные элементы индексируются в конце операции publi sh (OnPublishEndAsync).

С помощью сканеров, настроенных для индекса поиска, Sitecore выполняет итерацию по набору элементов и передает их в поисковый индекс с помощью платформы Search Provider. Во время индексации каждый элемент Sitecore преобразуется в элемент Coveo, и его текст извлекается.

Восстановление - это сканирование набора документов и их отправка в индекс. В конце процесса поисковый индекс будет содержать только просканированные документы. Поскольку Coveo Cloud - это онлайн-сервис, элементы необходимо загрузить, чтобы их можно было проиндексировать.

...