Как массивы в Excel переводить в R? - PullRequest
0 голосов
/ 23 января 2019

Я пытаюсь перейти от использования Excel к R, поскольку я слышал, что это более эффективно, особенно когда речь идет о большом количестве данных;так что я довольно новичок во всем этом.В настоящее время я работаю над выяснением того, как иметь два критерия на листе 2, чтобы связать их с листом 1, и заставить его получить среднее значение, 25-й процентиль, 50-й процентиль и 75-й процентиль.

Например, влист 2, столбец БИ имеют должность «Главный исполнительный директор».На листе 2, столбец C, у меня есть сокращение активов

. Итак, для вычисления ячейки I5 на листе 2 формула перейдет к листу 1 и рассмотрит столбец E и столбец AB, чтобы убедиться, что он соответствует листу 1,столбцы B и C. Затем необходимо взять все те значения, которые соответствуют в таблице 1, столбец G, и вычислить среднее значение.

Мои текущие формулы работают для Excel, но для сохранения изменения требуется 6 часов.

В настоящее время файл Excel превращен в файл csv.

Вот как это выглядит в форме Excel (зарплаты - значения $, но по соображениям конфиденциальности "x"): лист 1 лист 2

1 Ответ

0 голосов
/ 24 января 2019

Как указано в комментариях, трудно угадать, чего вы хотите достичь, и спросить, основываясь на предоставленной вами информации.Однако из скриншотов, которые вы связали, я предполагаю, что у вас есть одна электронная таблица с регистрами по базовому окладу и сокращению каждого сотрудника, и вы хотите вычислить некоторую статистику по базовому окладу, сгруппированную по сокращению и названию должности.

Электронная таблица данных можетимпортироваться в R довольно легко.Я предлагаю использовать кнопку «Импорт набора данных» в RStudio, которая сгенерирует для вас код для импорта электронной таблицы Excel.

Есть несколько способов выполнить необходимые вычисления в R. Возможно, более простой способиспользовать aggregate функцию с чем-то вроде:

aggregate(base_salary, by=list(job_title, cut), mean)

Это будет вычислять весь I столбец (средний) в вашей электронной таблице.Для столбцов от J до L (квартили):

aggregate(base_salary, by=list(job_title, cut), quantile, probs=c(.25,.5,.75))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...