быстрый вопрос, у меня есть данные следующего вида:
Тикер _ Дата _ Fem Analyst (фиктивная 1, если истина) ___ Переменные этого месяца, такие как бета
AA _ 01/04/2001 _ 1 ___ 0,61
AA _ 05/04/2001 _ 1 ___ 0,62
AA _ 08/04/2001 _ 1 ___ 0,63
AA _ 01/05/2002 _ 1 ___ 0,7
AA _ 04/05/2002 _ 1 ___ 0,71
AA _ 08/07/2002 _ 0 ___ 0,8
AA _ 07/04/2003 _ 1 ___ 0,4
и т. Д. Я хочу получить следующее:
Тикер _ Дата Количество женщин-аналитиков Количество мужчин-аналитиков _ Всего ___ Переменных
AA _ 04/2001 3 0 _ 3 ___ 0,63
AA _ 05/2002 2 0 _ 2 ___ 0,71
AA _ 07/2002 0 1 _ 1 ___ 0,8
AA _ 04/2003 1 0 _ 1 ___ 0,4
Итак, алгоритм подсчета, который позволяет мне подсчитывать количество аналитиков женского и мужского пола для определенной компании в месяц (используя фиктивную переменную пол 0 или 1) и удаляет все наблюдения за этот месяц, кроме самого последнего (например, для 08/04/01 это становится 04/01 с 0,63, что является самым последним наблюдением для бета-версии для 04/01 для компании AA) Пример объясняет все это, я думаю?
Есть идеи?