Я работаю со Stata, и у меня есть большой набор данных, где мне нужно сгруппировать записи вместе, если они совместно используют одну из двух переменных.
Например, возьмите следующие три наблюдения:
Observation | matching var1 | matching var2
1 xxx aaa
2 xxx bbb
3 yay bob
Если бы я должен был сгруппировать записи по var1
, первые два наблюдения будут в одной группе, а последнее наблюдениебудет в отдельной группе.Точно так же, если бы я должен был сгруппировать, используя var2
, наблюдения два и три были бы в одной группе, а наблюдение один будет в отдельной группе.Однако, если бы я должен был сгруппировать записи на основе совпадения по var1
или var2
, все наблюдения будут в одной группе.
Я хотел бы создать переменную 'group id', которая будет принимать одинаковое значение для всех этих записей.
Есть какие-нибудь предложения о том, как мне поступить?