Как извлечь аннотированные вручную твиты с помощью Twitter API? - PullRequest
0 голосов
/ 11 мая 2019

Я использую классификацию текста для классификации диалектов.Сначала мне нужны большие аннотированные вручную твиты, и я прочитал исследовательскую работу, в которой говорится:

Мы собрали твиты, которые были опубликованы в июне 2015 года. Арабские лингвисты вручную аннотировали небольшую часть этих твитов,таким образом, мы получили 51 589 твитов с правильными диалектными метками.Эти твиты были найдены вручную в Твиттере и аннотированы лингвистами.

Так что этот исследователь смог извлечь эти твиты, я хотел связаться с ним, но их электронные письма были недействительными.Он говорит, что эти твиты были опубликованы в июне 2015 года. Как я могу извлечь эти твиты?

Ответы [ 2 ]

1 голос
/ 11 мая 2019

Я должен был бы предположить, что исследователь делал это в режиме реального времени в течение июня 2015 года.

Сегодня единственный способ сделать это - использовать API полного поиска в архиве (платное платное предложение от Twitter).) искать эти твиты.Что касается аннотаций, они были бы частью их исследований;Твиттер не аннотирует твиты диалектными метками.

0 голосов
/ 26 мая 2019

насколько я знаю, исследователи не имели разрешения публиковать твиты, которые они собирают с помощью API Twitter.

...