У меня есть два фрейма данных, один из которых содержит временные метки, а другой - несколько твитов с их временными метками, которые выглядят следующим образом fig1 и fig2 . Я пытаюсь назначить твиты столбцу твитов во фрейме временных меток.
Если метка времени «t», тогда она может принимать все твиты, которые твитируются в интервале времени [t-30, t + 30). Я создал новый столбец под названием tweet во фрейме временных меток, который содержит пустые списки, и пытался распределить твиты, используя этот лог c:
for i in range(0,len(timestamps)):
for j in tweet_data.date:
if (pd.to_timedelta([(pd.Timestamp(timestamps.date[i])-pd.Timestamp(j))]).astype('timedelta64[m]')[0]) < 30 and (pd.to_timedelta([(pd.Timestamp(timestamps.date[i])-pd.Timestamp(j))]).astype('timedelta64[m]')[0]) >= -30 :
timestamps.iloc[i].tweets.append(tweet_data.tweet[getIndexes(tweet_data, j)])
Здесь getIndexes () используется для получения индекса временной метки планируемого твита. Поскольку оба фрейма данных большие, а циклы for вложены, выполнение занимает так много времени. Как я могу быстрее сопоставить твиты?
Заранее спасибо.