Что они подразумевают под "токенизацией" и
"ООН-токенизировать"?
Токенизация поля обеспечивает полнотекстовый поиск, то есть поиск любого слова, которое встречается в любом месте поля. Поле Untokenized будет найдено только тогда, когда у вас будет полное и точное совпадение, например, если в поле указано «голубая луна», оно будет найдено только при поиске «голубой луны», а не только при поиске только «голубой».
А что это значит, когда поля
"Нормализуется"?
Скорее всего, это относится к нормализации Unicode - Unicode имеет отдельные кодовые точки для диакритических знаков, например, U + 0060 - это `(серьезный акцент), поэтому акцентированная буква è может быть одним символом Unicode (U + 00E8) или состоять из двух (U + 0060 и U + 0065). Но, конечно, вы хотите, чтобы оба были найдены при поиске è.