Как определить порядок появления твитов (анализ выживания?)? - PullRequest
0 голосов
/ 06 марта 2019

Пытается придумать что-нибудь для любимого проекта и ужасно застрял: (

Проект сосредоточен вокруг порядка появления твитов. Я собрал твиты на 3 разные темы для 2 актеров. Я хочу определить, какой твит актера по каждой конкретной теме произошел раньше в целом. Друг посоветовал мне заглянуть в пакет «выживание», но я не мог понять, как он может работать. Любое предложение будет приветствоваться! Большое спасибо!

РЕДАКТИРОВАТЬ: Дополнительная информация

created_at           name
1544469754 chicagotribune
1541550304 chicagotribune 

party     type     topic
M         1        trade
M         1        trade

Переменная представляет следующую информацию

- создано в : время отправки твита

- имя : имя учетной записи Twitter

- партия : классификационная переменная политического склонности

- тип : двоичный индикатор (1 = тип носителя A, 0 = тип носителя B)

- тема : тема, к которой относится твит (всего 3 темы)

1 Ответ

2 голосов
/ 06 марта 2019

Я не думаю, что это проблема анализа выживания, вам просто нужно найти самую раннюю временную отметку в каждой теме.Я думаю, что-то вроде этого должно работать:

# Read in example data
df = readr::read_table("created_at           name    party     type     topic
1544469754 chicagotribune    M         1        trade
1541550304 chicagotribune    M         1        trade")

df %>%
    group_by(topic) %>%
    summarise(first_tweeter = name[which.min(created_at)])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...