Я делаю Java-приложение, в котором мне нужно будет определить, какие трендовые темы есть в конкретной коллекции твитов, полученных через поиск в Твиттере. При поиске в Интернете я обнаружил, что алгоритм определяет, что тема находится в тренде, когда она имеет большое количество упоминаний в определенное время, то есть в точный момент. Поэтому должен быть расчет затухания, чтобы темы часто менялись. Однако у меня есть еще одно сомнение:
Как твиттер определяет, какие конкретные термины в твите должны быть ТТ? Например, я заметил, что большинство ТТ являются хэштегами или именами собственными. Есть ли в этом смысл? Или они анализируют все слова и определяют частоту?
Я надеюсь, что кто-то может мне помочь! Спасибо!