Вероятно, из-за конфигурации http.content.limit , которая имеет значение 65 КБ в конфигурации , созданной артефактом .
Вы можете установить его на -1, чтобы сохранить весь контент.
Я заметил со страницы этого сайта, что основное содержание находится в элементе MAIN. Вы можете настроить ContentParseFilter так, чтобы он извлекал текст из этих элементов и использовал его в качестве текста документа, если он найден. Таким образом, вы не будете индексировать текст из шаблона в ES.