Если вы выполните запрос ниже
GET index28/_analyze
{
"text": "1RD.ISABELA.GRADOS",
"analyzer": "standard"
}
Ответ:
"tokens" : [
{
"token" : "1rd.isabela.grados",
"start_offset" : 0,
"end_offset" : 18,
"type" : "<ALPHANUM>",
"position" : 0
}
]
Для всего текста сгенерирован один токен. По умолчанию используется токенайзер с именем standard. Он разбивает текст по пробелам, а также удаляет большинство символов, таких как запятые, точки, точки с запятой и т. Д.
Так что только 1rd.isabela.grados будет соответствовать этому токену.
Если вы выполните нижезапрос
GET index28/_analyze
{
"text": "RD ISABELA GRADOS.",
"analyzer": "standard"
}
Ответ
"tokens" : [
{
"token" : "rd",
"start_offset" : 0,
"end_offset" : 2,
"type" : "<ALPHANUM>",
"position" : 0
},
{
"token" : "isabela",
"start_offset" : 3,
"end_offset" : 10,
"type" : "<ALPHANUM>",
"position" : 1
},
{
"token" : "grados",
"start_offset" : 11,
"end_offset" : 17,
"type" : "<ALPHANUM>",
"position" : 2
}
]
Сгенерировано 3 токена. Поэтому поиск по любому из этих токенов вернет документы