Я пытаюсь итеративно сортировать данные в столбцах, чтобы извлечь N максимальных значений.
Мои данные настроены на первый и второй столбцы, содержащие названия и коды занятий, а все остальные столбцы содержат сравнительные значения (в этом случае коэффициенты местоположения, которые должны были быть предварительно рассчитаны для каждого города)для этих профессий для разных городов:
*occ_code city1 ... city300*
occ1 5 ... 7
occ2 20 ... 22
. . . .
. . . .
occ800 20 ... 25
Для каждого города, который я хочу отсортировать по максимальным значениям, выберите подмножество этих максимальных значений, соответствующих их названиям и названиям профессий.Я думал, что это будет относительно тривиально, но ...
отредактируйте для уточнения: Я хочу закончить с отсортированным подмножеством данных для анализа.
occ_code city1
occ200 10
occ90 8
occ20 2
occ95 1.5
В то же время я хочу иметь возможность повторять сортировку по столбцам (поэтому я пробовал множество команд упорядочения посредством непосредственного вызова столбцов: data [, 2]; просто чтобы иметь возможность запускать одни и те же функции анализа для всегонабор данных.
Последние 3 дня я связывался с plyr, и мне кажется, что настройка моего набора данных просто не способствует тому, как должен использоваться plyer.