Как я могу получить carrot2 для кластеризации документов из пользовательских источников, таких как nytimes.com, theguardian.com et c? Как мне начать с этим? Я пытаюсь сделать это, используя Java. Будет ли кластеризация работать на основе результатов, основанных на каком-либо запросе из одного источника, например https://www.nytimes.com/?