Я занимаюсь анализом настроений местных жителей в отношении транспортных услуг в Гонконге. Я использовал API Twitter для сбора твитов. Однако, поскольку моей целью исследования являются местные жители Гонконга, твиты, отправленные, например, путешественниками, должны быть удалены. Может ли кто-нибудь дать мне несколько советов о том, как извлечь твиты, опубликованные местными жителями, учитывая большой объем данных в Твиттере? Моя идея сейчас состоит в том, чтобы создать словарь, который содержит слова, относящиеся к путешествиям, и использовать эти слова для фильтрации твитов. Но может показаться, что не работает
Любые советы и идеи приветствуются! Спасибо!