Я работаю с набором данных, который содержит 40 разных участников, по 30 наблюдений для каждого. Наблюдая за поведением поиска, я хочу рассчитать расстояние поиска для каждого предмета за раунд (от 1 до 30).
Чтобы сравнить мои данные с текущей литературой, мне нужно использовать расстояние Хэмминга для описания расстояний поиска.
Переменная называется Inputs
и представляет собой строковую переменную с двоичными входами 0 или 1 с длиной 10. Например: Входной Тип 1 Тема 1 Раунд 1: 0000011111 Вход Тип 1 Тема 1 Раунд 2: 0000011110
Используя расстояние Левенстейна, мой подход был прост:
sort type_num Subject round_num
gen input_prev=Input[_n-1]
replace input_prev="0000000000" if round_num==1 //default starting position with 0000000000 to get search distance for first input in round 1
//Levensthein distance & clearing data (Levensthein instead of hamming distance)
ustrdist Input input_prev
rename strdist input_change
Сейчас я пытаюсь получить правильные команды Stata для расстояния Хэмминга. Может кто поможет?