Итерация кадра данных pandas без использования вложенных циклов for - PullRequest
1 голос
/ 04 августа 2020

У меня есть два фрейма данных, один из которых содержит временные метки, а другой - несколько твитов с их временными метками, которые выглядят следующим образом fig1 и fig2 . Я пытаюсь назначить твиты столбцу твитов во фрейме временных меток.

Если метка времени «t», тогда она может принимать все твиты, которые твитируются в интервале времени [t-30, t + 30). Я создал новый столбец под названием tweet во фрейме временных меток, который содержит пустые списки, и пытался распределить твиты, используя этот лог c:

for i in range(0,len(timestamps)):
    for j in tweet_data.date:
         if (pd.to_timedelta([(pd.Timestamp(timestamps.date[i])-pd.Timestamp(j))]).astype('timedelta64[m]')[0]) < 30 and (pd.to_timedelta([(pd.Timestamp(timestamps.date[i])-pd.Timestamp(j))]).astype('timedelta64[m]')[0]) >= -30 :
             timestamps.iloc[i].tweets.append(tweet_data.tweet[getIndexes(tweet_data, j)]) 

Здесь getIndexes () используется для получения индекса временной метки планируемого твита. Поскольку оба фрейма данных большие, а циклы for вложены, выполнение занимает так много времени. Как я могу быстрее сопоставить твиты?

Заранее спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...