Во-первых, как упоминалось в блоге, an Inference Ingest Processor
- это функция машинного обучения (ML), и, если у вас нет варианта использования, она вам не нужна, также она является частью X-pack, а не ядром Elasticsearch, поэтому у вас может быть чтобы включить модуль X-pack и купить, если он не включен в базовый c уровень X-pack.
Переходя к вашему второму вопросу, как упоминалось в блоге, два подхода: один имеет отдельный индекс для Таким образом, вам не нужно определять все поля c для каждого языка. Второй способ, который мы используем, - это одно поле для каждого языка, и все языки будут частью одного индекса.
Нет накладных расходов на обслуживание 8 настраиваемых анализаторов, так как большинство анализаторов встроено, вы можете проверить языковые анализаторы , которые все поддерживаются в вашем случае использования. А другие, если вам нужно его создать, будут всего лишь одноразовыми усилиями и будут частью вашей настройки и сопоставления.
Ниже приведен один пример сопоставления индексов для подхода по каждому полю, где я использую встроенный анализатор из наиболее распространенных языков.
{
"mappings": {
"properties": {
"en": {
"type": "text",
"analyzer": "english"
},
"russian": {
"type": "text",
"analyzer": "russian"
},
"spanish": {
"type": "text",
"analyzer": "spanish"
},
"swedish": {
"type": "text",
"analyzer": "swedish"
}
}
}
}