Я новичок в Lucene, я начал изучать ветку версии 3, и есть одна вещь, которую я не понимаю (очевидно, потому что у меня нет опыта в этой области).
В Lucene 2.9, если бы я хотел получить список токенов, я бы создал ArrayList класса Token, например, ArrayList. Это довольно интуитивно понятно для меня, и концепция токена очень ясна.
Теперь, когда использование класса Token не поощряется в пользу API на основе атрибутов, нужно ли мне создавать свой собственный класс для инкапсуляции нужных мне атрибутов? Если да, разве это почти не воссоздает класс Token Lucene?
Я делаю урок для тестирования анализаторов, и, думаю, наличие списка получаемых токенов облегчает тестирование.
Любая помощь будет оценена;)
Спасибо!