Попробуйте найти уникальное значение в источнике данных, который вы индексируете, и сохраните его в документе lucene. Источником данных может быть база данных mysql, файлы из файловой системы и т. Д.
Например, если вы индексируете контент из базы данных mysql, вы можете собрать уникальный идентификатор, используя имя таблицы и идентификатор первичного ключа " tablename_rowID ".
Допустим, вы индексируете из двух таблиц 'pages' и 'comments' table; для каждой строки в таблице страниц вы можете сгенерировать уникальный идентификатор, используя «page_28» для строки с идентификатором 28 в вашей таблице страниц. Точно так же, допустим, вы индексировали строку 36 в таблице комментариев, ваш уникальный идентификатор будет «comment_36».
Если все параметры потерпят неудачу, я буду придерживаться UUID. При некоторой дополнительной паранойе это может быть UUID, добавленный к метке времени now ().