Новичок в python и pandas, с трудом находя решение ниже:
У меня есть одна электронная таблица с данными ниже; Я пытаюсь создать новый столбец для каждого комментария Facebook с соответствующим текстом из его родительского сообщения.
Итак, отсюда: Исходный формат Excel 
To this:
Target Format
введите описание изображения здесь
Заполнив новый столбец 'original_post_text' с 'sound_bite_text' когда 'OP_from_comment' = 'OP_from_post'
import pandas as pd
excel_file = 'test.xlsx'
data = pd.read_excel(excel_file)
original_posts = data[(data.post_type == "Original") & (data.source_type == "Facebook")]
comments = data[(data.post_type == "Replies and Comments") & (data.source_type == "Facebook")]
Я подумал, что должен создать 2 набора; один для комментариев и один для оригиналов и подобных примеров в Интернете присоединился бы к ним, но это возвращает ошибки
print data[comments['OP_from_comment'].isin(original_posts['OP_from_post'])].drop(['source_type'], axis=1)
Есть какие-нибудь указатели для меня?