У меня большой несбалансированный набор данных панели, который выглядит следующим образом:
clear
input year id income
2003 513 500
2003 517 500
2003 518 100
2003 525 900
2003 528 800
2003 531 0
2003 532 300
2003 534 600
2004 513 1000
2004 517 120
2004 523 300
2004 525 700
2004 528 800
2004 531 200
2004 532 600
2004 534 100
end
Я хочу случайным образом выбрать некоторых людей по id
.В диапазоне id
имеются пробелы в положительных натуральных числах (минимум 513
и максимум 287321
, но есть некоторые пропуски панели, например 514
, 515
, 516
).
Мне нужно сохранить функцию панели данных.Следовательно, если выбран случайный идентификатор, необходимо сохранить любую комбинацию идентификатора года.Мне не нужна случайная выборка данных (ни 10%, ни 10 наблюдений).Скорее меня интересует случайный id-номер из моего id-столбца / переменной, хранящийся таким образом, чтобы я мог впоследствии использовать его.
Таким образом, я ищу команду типа «выбрать одно случайное значение из заданного набора значений из идентификатора столбца».Впоследствии я хочу использовать этот случайно выбранный идентификатор в таких командах, как:
xtline income if id==X
, который должен показывать мне доход за весь год случайного человека / ID X.