SAS / R рассчитать расстояние между двумя группами - PullRequest
0 голосов
/ 30 ноября 2011

Я хотел бы рассчитать расстояние между двумя группами.Я очень смущен.

У меня есть два набора данных.Один из них о компании, а другой о сотрудниках.

Я хотел бы узнать, насколько их возраст (компания, в которой наемный работник и сотрудник) похожи или нет.Я думаю, что мне нужно стандартизировать также ..

  1. рассчитать евклидово расстояние между каждым человеком и компанией.(4-5 человек в компании)
  2. рассчитывают евклидово расстояние между каждым человеком и компанией на отраслевом уровне.

Мой набор данных выглядит следующим образом:

person person_age    company company_age industry              

1        50             1       5         1

2        40             1       5         1

3        30             2        1        1

4        20             2        1        1

5        25             3        8        2

Следующий код будет воспроизводить мои данные.Я не против использования SAS или R. Я очень смущен.

Ответы [ 2 ]

3 голосов
/ 30 ноября 2011

Так что, если вы просто хотите, чтобы Евклидово расстояние соответствовало возрасту каждого человека, вы можете сделать что-то вроде:

d <- dist(myData[c("person","person_age")])

Ваш вопрос все еще невероятно искажен.Например, что означает «вычислить [sic] евклидово расстояние между каждым человеком и компанией»?

Если вы просто хотите узнать расстояние между каждым человеком и компанией, в которой он работает, вы можете закодировать это как:

 with(myData, ((person_age - company_age)^2)^.5 ) 

, что является просто формулой 2-го евклидова расстояния

0 голосов
/ 30 ноября 2011

В этом посте рассказывается о расчете евклидова расстояния.Преобразуйте данные в два вектора и выполните шаги.

...