Вычисление новой переменной на основе значений ранее существующих переменных - PullRequest
1 голос
/ 24 апреля 2019

Я пытаюсь создать три новые переменные на основе существующих переменных в данных. Я пытаюсь создать: Market_A (цифра), Segment_A (строка) и Sub-Segment_A (строка).

Я пытаюсь основать их на существующих переменных: Market (числовые), Segment (строка), Sub-Segment (строка), Email (строка) и Week (цифра).

Мои данные содержат список адресов электронной почты, которые могут быть в течение недель 1-6. Их Рынок, Сегмент и Подсегмент могут меняться в зависимости от недели их появления. (то есть Джейн может появиться на 1-й неделе как США, а на 6-й неделе как Канада).

Моя цель в новых столбцах - размещать только свои Рынок, Сегмент и Подсегмент с 6-й недели каждый раз, когда появляется их адрес электронной почты (даже через неделю).

Если они вообще не появятся на 6 неделе, я не хочу, чтобы что-то появлялось в моих трех новых столбцах.

Например:

enter image description here

Спасибо!

1 Ответ

1 голос
/ 24 апреля 2019

Я предполагаю, что данные повторяются, если неделя 6 появляется более одного раза или эта неделя 6 появляется не более одного раза.

if week=6 market_A=market.
string segment_A subsegment_A (a5).
if week=6 segment_A=segment.
if week=6 subsegment_A=subsegment.

aggregate outfile=* mode=addvariables overwrite=yes/break email
   /market_A segment_A subsegment_A=max(market_A segment_A subsegment_A)
...